红酒、白酒数据集分析

您所在的位置:网站首页 red葡萄酒 红酒、白酒数据集分析

红酒、白酒数据集分析

#红酒、白酒数据集分析| 来源: 网络整理| 查看: 265

详见:red_white_wine_quality数据集分析

(一)数据集概览 有两个样本: winequality-red.csv:红葡萄酒样本 red-wine 数据集 winequality-white.csv:白葡萄酒样本 white-wine 数据集 每个样本都有得分从1到10的质量评分,以及若干理化检验的结果

#理化性质字段名称1固定酸度fixed acidity2挥发性酸度volatile acidity3柠檬酸citric acid4残糖residual sugar5氯化物chlorides6游离二氧化硫free sulfur dioxide7总二氧化硫total sulfur dioxide8密度density9PH值pH10硫酸盐sulphates11酒精度alcohol12质量quality

(二)问题提出

根据此数据集中的列的直方图,以下哪个特征变量显示为右偏态?固定酸度、总二氧化硫、pH 值、酒精度根据质量对不同特征变量的散点图,以下哪个最有可能对质量产生积极的影响?_挥发性酸度、残糖、pH 值、酒精度某种类型的葡萄酒(红葡萄酒或白葡萄酒)是否代表更高的品质?哪个酸度水平的平均评分最高?酒精含量高的酒是否评分较高?口感较甜的酒是否评分较高?

(三)分析步骤

导入数据和库依赖import

修改不规范的列名rename

合并数据集append

基本数据分析:列数、缺失值统计、重复行统计duplicated、唯一值数量unique、平均值mean等等

保存修改后的数据集to_csv

可视化探索plot:绘制柱状图plot.hist、查看偏态skew、子图plt.subplots

分组并绘图:groupby



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3