SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】

您所在的位置:网站首页 sql如何使用正则表达式从一段文字中提取数字 SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】

SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】

#SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】| 来源: 网络整理| 查看: 265

文章目录 一、数据提取二、数据查询1、选取数据(select)2、筛选(where)3、范围匹配(IN)4、排序(order by)5、条件筛选(case when) 三、数据清洗四、数据分组五、连接查询

一、数据提取

1、获得用户表、启动表与功能表 (1)用户表:用户个人信息与订单信息

(2)启动表:日期、时间等

(3)功能表:是否成功、功能、渠道、耗时等

注意:当进入数据分析岗位,需要向数据部门获得数据时必须把关键字段列出来,数据部门才会将相应字段下的数据发给我们。

2、获取数据字典(desc) 数据字典指的就是数据表中的关键字段与关键字段信息;

语法示例:desc user_info; --分号不能少;

也就是宏观查看数据字段。

二、数据查询 1、选取数据(select)

(1)语法示例:select * from user_info; --选取用户信息表中的所有数据

以上的*代表所有内容,关于SQL语句的具体语法规则与详细分析,请参阅: MySQL数据库基础(数据表的SELECT操作)

(2)查询特定行数(limit) 语法示例:select * from user_info limit 10; --查看数据表前10行数据,无排序

2、筛选(where)

(1)语法结构:select 字段名 from 表名 where 筛选条件;

(2)精准匹配:>、=、150; --统计JS成绩大于80的name的个数 select count(name) from ExamResult where JavaScript>80; --计算所有name的JS平均分:JavaScript总分/name个数 select sum(JavaScript)/count(name) from ExamResult;

(8)逻辑运算符 2.2.1

3、范围匹配(IN)

(1)作用:让SQL能返回某个变量部分指定值的结果

(2)格式:IN(值1,值2,值…值n),满足任一值,即满足了where的筛选条件

(3)语句示例(IN实现):

select * from d_function where if_install IN ('install','uninstall') AND date='2022-4-15'; --从功能表中找出所有满足“已安装或未安装,且日期未2022年4月15日”的行

(4)上述示例的OR实现:

select * from d_function where (if_install='install' OR if_install='uninstall') AND date='2022-4-15'; --从功能表中找出所有满足“已安装或未安装,且日期未2022年4月15日”的行

通过对比可以发现,IN实现就是OR的简便写法,当有很多个条件需要进行OR筛选时,则可以都放进IN的参数中进行条件判断。

4、排序(order by)

(1)作用:将特定字段进行排序

(2)语法结构:select 字段名 from 表名 order 字段名;

(3)默认是升序排序,加上desc则为降序

(4)在已安装软件中按照日期进行降序排序:

select * from d_function where if_install='install' order by date desc; 5、条件筛选(case when)

(1)作用:根据是否满足语句中的判断条件选取不同的取值,可以对数据进行重新分类、整理和命名。

(2)语法结构:

CASE WHEN 条件1 THEN 结果1 WHEN 条件2 THEN 结果2 ELSE 默认结果 END

(3)筛选成功交易和失败交易的所有订单创建时间和收货地址:

select 订单创建时间,收货地址, case when 退款金额=0 then '成功交易' when 退款金额>0 then '失败交易' else '无效' end from 天猫订单;

注意:这里的case…when筛选语句是在select下面的,因此筛选结果会将case…when的筛选结果新建一列进行显示。 5.1

(4)AS变量重命名 主要用于分组之后进行命名。 如将上面示例中case…when筛选的结果列命名为交易有效性,订单创建时间命名为 时间,收货地址命名为地址:

select 订单创建时间 AS 时间,收货地址 AS 地址, case when 退款金额=0 then '成功交易' when 退款金额>0 then '失败交易' else '无效' end AS 交易有效性 from 天猫订单;

5.2

三、数据清洗

1、主要工作 检查数据异常、使用代码进行数据清洗,也就是常用的增(insert)、删(delete)、改(update),其中insert较少使用,实际工作中是根据< CheckList >中的要求进行数据清洗。

2、update更新表中具体字段信息 (1)语法结构:update 表名 set 字段=‘更新内容’ where 条件;

(2)用处:当数据非常多、不清楚正确值时,就可以使用delete将异常值删除

(3)操作步骤: 3.2.1 (4)代码示例:

#数据检查 select DISTINCT 订单金额 from 天猫订单; #查看异常数据 select * from 天猫订单 where 订单金额


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3