Python项目:分析优衣库产品销售数据 |
您所在的位置:网站首页 › 优衣库之类的服装店名叫什么好听 › Python项目:分析优衣库产品销售数据 |
一、数据分析目的
优衣库(英文名称:UNIQLO,日文假名发音:ユニクロ),为日本迅销公司的核心品牌,建立于1984年,当年是一家销售西服的小服装店,现已成为国际知名服装品牌。优衣库现任董事长兼总经理柳井正在日本首次引进了大卖场式的服装销售方式,通过独特的商品策划、开发和销售体系来实现店铺运作的低成本化,由此引发了优衣库的热卖潮。 优衣库(Uniqlo)的内在涵义是指通过摒弃了不必要装潢装饰的仓储型店铺,采用超市型的自助购物方式,以合理可信的价格提供顾客希望的商品价廉物美的休闲装“UNIQLO”是UniqueClothing Warehouse的缩写,意为消费者提供“低价良品、品质保证”的经营理念,在日本经济低迷时期取得了惊人的业绩。 数据来源:数据集来自往网上公开的数据,是一份有关优衣库销售数据(链接:https://pan.baidu.com/s/1VsGtuGm2hyVBmuIQ4CMh8g 提取码:apvl ) 共有22294条记录,13个字段 本文,将根据优衣库的销售数据,利用Python进行可视化,了解优衣库门店的销售情况,并回答如下问题: 1.整体销售情况随着时间的变化是怎样的? 2.不同产品的销售情况是怎样的? 3.顾客偏爱哪一种购买方式? 4.销售额和产品成本之间的关系怎么样? 二、数据分析基本过程 1、理解数据对销售按照时间维度来分析 数据: 时间维度:购买发生的时间(周末or周中)wkd_ind 销售数据:顾客人数customer、销售金额revenue、订单数量order、销售数量quant, 通常情况下分析的是销售额 方法:生成柱状图进行可视化 关键操作&核心代码: 柱状图:sns.barplot(),谁是x,谁是y,bar是什么含义? # 销售额随时间的变化 plt.figure(figsize=(6,5)) sns.barplot(x='wkd_ind',y='revenue',data=uniqlo)
对销售情况按照产品维度、顾客维度来分析 数据: 顾客维度:不同城市city,性别gender_group、年龄段age_group、渠道购买方式channel(线上or线下) 产品维度:产品类别product,产品成本unit_cost 销售数据:销售金额revenue 方法:生成柱状图进行可视化 关键操作&核心代码: 柱状图:sns.barplot() 注意点: 1.如何排序:order = uniqlo.groupby(‘product’).revenue.mean().sort_values(ascending = False).index 2.顾客偏爱哪一购买方式,比较的是购买方式,作为hue分类别;而不同的顾客有不同的购买方式,作为x,分组展示;偏爱可以用销售额还体现 uniqlo.groupby(['product']).revenue.describe()
从销售额总额角度看,除广州外,武汉、上海、重庆、西安的顾客更偏好线下购物。 同样,也可以看销售总量,以及平均情况,在此不做赘述。 # 1.不同性别的顾客,线上、线下方式的对比 plt.figure(figsize=(8,6)) sns.barplot(x='gender_group',y= 'revenue',hue ='channel',data = uniqlo, estimator =sum, order =uniqlo.groupby('gender_group').revenue.sum().sort_values(ascending=False).index ) #报错:SyntaxError: unexpected EOF while parsing,括号没打
数据: 总销售额为revenue,销售数量quant,单价成本unit_cost, 单价销售额 = revenue/quant, 比较单件销售额和单价成本 思路一: 单件产品销售额 - 成本 为利润margin,margin是如何分布的?是否存在亏本销售的产品 关键操作:以产品类型x,margin为y,生成箱型图进行可视化可以看到分布情况 思路二: 探究实际销售额和产品成本之间的关系,即为求它们之间的相关, 若成正相关,则产品成本越高,销售额越高,或许为高端产品;若为负相关,销售额越高, 为薄利多销的模式。 关键操作: 计算单件销售额和单件产品成本之间的相关性,corr(),sns.heatmap()热力图可视化 # 新增'利润'字段 uniqlo['margin']= uniqlo.unit_price - uniqlo.unit_cost uniqlo.head() # 注意:新增一列的写法,不能写成uniqlo.margin
毛衣在箱型图的异常集中在尾部,说明优衣库经常进行毛衣促销活动。 # 计算单价销售额和单件产品成本之间的相关性 q = ['margin','unit_price','unit_cost'] #列选择 uniqlo[q].corr() |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |