基于MYSQL和Tableau分析天猫双十一美妆销售数据集

您所在的位置:网站首页 天猫数据集 基于MYSQL和Tableau分析天猫双十一美妆销售数据集

基于MYSQL和Tableau分析天猫双十一美妆销售数据集

2024-07-09 19:21| 来源: 网络整理| 查看: 265

第一次完整完成一个项目,磕磕绊绊,就此梳理一下

一、原始数据概览

将数据导入navicat,创建一个练习表,设置字段名及类型

1、原始数据字段名称及类型

2、导入原始数据

导入结果如图

二、数据处理 1、添加新字段(日期列、销售额、天) ALTER TABLE 练习表 ADD COLUMN dates DATE; ALTER TABLE 练习表 ADD COLUMN 销售额 float; ALTER TABLE 练习表 ADD COLUMN DAY varchar(2);

给新加列插入数据

update 练习表 set dates=substring(update_time,1,10) update 练习表 set 销售额=price*sale_count update 练习表 set DAY=substring(dates,9,10)

select * from 练习表  limit 10

结果如下

2、缺失值处理 select * from 练习表 where update_time is NULL or id is NULL or title is NULL or price is NULL or sale_count is NULL or comment_count is NULL or 店名 is NULL

此时显示有2354条缺失值的

将有缺失值的都替换为0

UPDATE 练习表 set sale_count=0 WHERE sale_count is null UPDATE 练习表 set comment_count=0 WHERE comment_count is null 3、重复值处理 SELECT update_time, id, title, COUNT(*) AS count     FROM 练习表     GROUP BY update_time, id, title   HAVING count(*) > 1

运行结果

有86条重复数据,进行去重处理

DELETE 练习表 from 练习表,( SELECT update_time,id,title,min(xuhao) xuhao FROM 练习表 GROUP BY update_time,id,title HAVING count(*)> 1) a1 where 练习表.update_time=a1.update_time and 练习表.id=a1.id and 练习表.title=a1.title and 练习表.xuhao>a1.xuhao

执行最终显示无重复记录

三、数据分析

       分析逻辑从双十一总体销售额和总体销量——日销售额和销售——品牌总体销售额和销量——品牌日销售额和销量——品牌商品数量——品牌平均商品销售额——品牌商品平均价格——每个价格区间品牌销售额——品牌热度

1、双十一总体销售情况 (1)代码 --查询数据 SELECT dates,sum(销售额) 总销售额,sum(sale_count)总销量 from 练习表 GROUP BY dates --创建表存储数据 CREATE table 双十一日销售概览(dates date,销售额 FLOAT,销量 FLOAT) --插入数据 INSERT into 双十一日销售概览 SELECT dates,sum(销售额) 总销售额,sum(sale_count)总销量 from 练习表 GROUP BY dates (2)运行结果

(3)可视化结果

(4)总结

       可以看出双十一当天11号的销售额及销售量最少,9号销售额及销售量最大,9号之前销售额基本处于持续上升的趋势,猜测可能是因为双十一提前预热的缘故,随着双十一当天越来越临近,宣传力度越来越大,人们给予的关注越来越多,而因为双十一当天人们可能因为认为会人数过多,而不去凑当天的热闹,在11号之后销售额略有回升,猜测是因为节日接近尾声,宣传各种紧迫感,错过再等一年等消息,造成有些消费者进行冲动消费及有些预售顾客可能进行二次消费。

2、品牌销售总览 (1)代码 --查询数据 SELECT 店名,sum(销售额)销售额, sum(sale_count) 销量,count(title) from 练习表 GROUP BY 店名 --创建表 CREATE table 品牌销售概览(店名 VARCHAR(20),销售额 FLOAT,销量 FLOAT,商品数量 int) --插入数据 INSERT into 品牌销售概览 SELECT 店名,sum(销售额)销售额, sum(sale_count) 销量,count(title) 商品数量 from 练习表 GROUP BY 店名 (2)可视化结果

(3)小结

       根据可视化结果看出,相宜本草无论是销售额还是销量都遥遥领先,欧莱雅、佰草集、美宝莲、悦诗风吟分别销售位居第2—5位,销量美宝莲、悦诗风吟、妮维雅、欧莱雅位居第2—5位,通过对比发现,欧莱雅销售额位居第二,但是销量仅排在第五位,反而是销售额未进前5的妮维雅,销量竟然排在了第四位,我们由此推测可能与品牌平均售价有关,妮维雅整体品牌售价较低,而欧莱雅相比品牌价格定位更加高端,同理相宜本草销量快超过欧莱雅的一倍,但是其销售额仅仅只多了不到百分之二十,这都揭示了不同品牌定价与销量和销售额的问题,我们在后面会进行一一验证,所以针对定价较低的品牌,可以通过扩大宣传,找网络头腰部带货,提升曝光量,以价格优势扩大销量。

3、品牌每日销售概览 (1)代码 --查询数据 SELECT 店名,dates,sum(销售额)销售额, sum(sale_count) 销量 from 练习表 GROUP BY 店名,dates --创建表 CREATE table 品牌每日销售概览(店名 VARCHAR(20),dates date,销售额 FLOAT,销量 FLOAT) --插入数据 INSERT into 品牌每日销售概览 SELECT 店名,dates,sum(销售额)销售额, sum(sale_count) 销量 from 练习表 GROUP BY 店名,dates (2)可视化结果

4、品牌商品平均销售额、品牌均价 (1)代码 --查询数据 SELECT 店名,ROUND(avg(销售额),2)平均商品销售额,round(avg(price),2) 品牌商品均价 from 练习表 GROUP BY 店名 --创建表 CREATE table 品牌均值(店名 VARCHAR(20),平均销售额 FLOAT,品牌均价 FLOAT) --插入数据 INSERT into 品牌均值 SELECT 店名,ROUND(avg(销售额),2)平均商品销售额,round(avg(price),2) 品牌商品均价 from 练习表 GROUP BY 店名 (2)可视化结果

(3)总结

从图中可以看出娇兰、SKLL、雪花秀、雅诗兰黛、兰蔻、资生堂品牌均价均超过了500元,定位高端产品,兰芝、倩碧、玉兰油、植村秀均超过300元,定位中高端产品,我们可以看出大多数的品牌定价都处于200—400以内

5、价格区间品牌占比销售额

为了方便我们看出各个价格区间品牌的竞争力,我们将定价进行一个区间划定,看看每个区间品牌的贡献情况。

(1)代码 --查询数据,利用case when 函数对均价进行区间划分 SELECT 品牌销售概览.店名,销售额,品牌均价, CASE WHEN 品牌均价>0 and 品牌均价100 and 品牌均价< 300 then 'B' when 品牌均价>300 and 品牌均价< 500 then 'C' when 品牌均价>500 then 'D' end as 价格区间 from 品牌销售概览 join 品牌均值 on 品牌销售概览.店名=品牌均值.店名 --创建表 CREATE TABLE 品牌价格区间(店名 VARCHAR(20),销售额 FLOAT,品牌均价 int,价格区间 VARCHAR(20)) --插入数据 INSERT into 品牌价格区间 SELECT 品牌销售概览.店名,销售额,品牌均价, CASE WHEN 品牌均价>0 and 品牌均价100 and 品牌均价< 300 then 'B' when 品牌均价>300 and 品牌均价< 500 then 'C' when 品牌均价>500 then 'D' end as 价格区间 from 品牌销售概览 join 品牌均值 on 品牌销售概览.店名=品牌均值.店名 (2)可视化结果 (3)总结

从中看出,品牌均价在100到300之间的品牌最多,该区间销售额也最多,其中相宜本草销售额占比最大、其次为欧莱雅,说明目前美妆市场消费者还是更加倾向于购买中端产品,以实用性价比为主,更看重价格,所以在中端产品宣传中,要更突出自己产品的价格优势,围绕性价比展开宣传推广。而对于定价超过500的高端产品,品牌则可以通过宣传自己独特的功效以及在保持不影响品牌调性的基础上适当进行价格的折扣,比如可以限时限量抢购、明星产品组合套装等。

6、品牌讨论热度 (1)代码 CREATE TABLE 品牌讨论(店名 VARCHAR(20),评论数量 int) INSERT into 品牌讨论 SELECT 店名,sum(comment_count) 评论数量 from 练习表 GROUP BY 店名 (2)可视化结果

(3)总结

由评论热度我们可以看出,悦诗风吟排名第一,妮维雅排名第二、美宝莲排名第三,通过与前面销售额对比来看,会发现悦诗风吟销售额仅仅排名第五,但是讨论第一,妮维雅销售额为第九,但是讨论量第二,我们可以推测这两个品牌是因为其品牌均价低,但是其话题讨论热度高,所以其销售额能够超过比他定价高的兰蔻等大品牌,已经是不错的表现,证明其种草宣传曝光收割能力还是比较亮眼的,所以品一些低价品牌在大促期间可以通过加大宣传投入,制造热门话题紧跟热点,引导消费者参与,通过与知名带货主播网红合作,提升品牌曝光,通过短视频引流直播间收割 的方式也是可以取得亮眼的成绩的,在这个营销为王的时代,消费者对于大品牌的追求已然掉下热度,更追求性价比。

7、总结

1、双十一当天销售额及销量最低,在9号销售额及销量都最大,在9号前销售额基本呈上涨趋势,这表明活动预热期的效果比较明显,随着双十一当天的到来,活动的宣传力度越来越大,越来越多的消费者加入活动消费中,这可能与从众效应以及早拍早享受的营销心理有关,而双十一当天可能顾客因为之前已经预售购买了产品,而降低了当天的关注,另外也有可能因为当天人数过多,造成网络卡顿瘫痪等缘故,影响了销售量。

2、双十一过后几天销售额有些许的回升,这可能与活动快要结束,商家营销的错过再等一年、限时返场等等宣传有关,刺激了一些在之前收到宣传影响但迟迟未下单的用户,以及可能有部分消费者进行二次消费等等;

3、品牌定价价位主要集中在100—300之间,该区间品牌销售额占比双十一销售总额近75%,足以看出这个价格市场的价值,目前看来,绝大部分消费者还是更看重价格、追求性价比,所以在大促期间尽量围绕直接降价折扣来提升销售量。

4、针对定价低的品牌可以通过扩大宣传力度,跟随热点话题提升曝光量,通过与知名带货主播合作,提升品牌的知名度,打出价格优势,在短时间内完成高曝光量,完成种草收割,通过短视频引流和直播间收割短直共振方式来提升销量,从而提高销售额。

5、对于定价高的品牌,可以通过找垂类博主种草、测评等突出自己品牌产品的独特功效之处,打爆明星产品,通过明星产品等组合装提升客单价,增加销售额,另在大促期间也可以通过与头部主播直播间合作,在不影响品牌调性基础上,适当打折,增加销量,完成即时收割。

以上内容仅为了本人学习过程中的想法以及思路做梳理,如有不完善,欢迎大家沟通交流



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3