SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】 |
您所在的位置:网站首页 › sql如何使用正则表达式从一段文字中提取数字 › SQL数据分析之数据提取、数据查询、数据清洗【MySQL速查】 |
文章目录
一、数据提取二、数据查询1、选取数据(select)2、筛选(where)3、范围匹配(IN)4、排序(order by)5、条件筛选(case when)
三、数据清洗四、数据分组五、连接查询
一、数据提取
1、获得用户表、启动表与功能表 (1)用户表:用户个人信息与订单信息 (2)启动表:日期、时间等 (3)功能表:是否成功、功能、渠道、耗时等 注意:当进入数据分析岗位,需要向数据部门获得数据时必须把关键字段列出来,数据部门才会将相应字段下的数据发给我们。 2、获取数据字典(desc) 数据字典指的就是数据表中的关键字段与关键字段信息; 语法示例:desc user_info; --分号不能少; 也就是宏观查看数据字段。 二、数据查询 1、选取数据(select)(1)语法示例:select * from user_info; --选取用户信息表中的所有数据 以上的*代表所有内容,关于SQL语句的具体语法规则与详细分析,请参阅: MySQL数据库基础(数据表的SELECT操作) (2)查询特定行数(limit) 语法示例:select * from user_info limit 10; --查看数据表前10行数据,无排序 2、筛选(where)(1)语法结构:select 字段名 from 表名 where 筛选条件; (2)精准匹配:>、=、150; --统计JS成绩大于80的name的个数 select count(name) from ExamResult where JavaScript>80; --计算所有name的JS平均分:JavaScript总分/name个数 select sum(JavaScript)/count(name) from ExamResult; (8)逻辑运算符 (1)作用:让SQL能返回某个变量部分指定值的结果 (2)格式:IN(值1,值2,值…值n),满足任一值,即满足了where的筛选条件 (3)语句示例(IN实现): select * from d_function where if_install IN ('install','uninstall') AND date='2022-4-15'; --从功能表中找出所有满足“已安装或未安装,且日期未2022年4月15日”的行(4)上述示例的OR实现: select * from d_function where (if_install='install' OR if_install='uninstall') AND date='2022-4-15'; --从功能表中找出所有满足“已安装或未安装,且日期未2022年4月15日”的行通过对比可以发现,IN实现就是OR的简便写法,当有很多个条件需要进行OR筛选时,则可以都放进IN的参数中进行条件判断。 4、排序(order by)(1)作用:将特定字段进行排序 (2)语法结构:select 字段名 from 表名 order 字段名; (3)默认是升序排序,加上desc则为降序 (4)在已安装软件中按照日期进行降序排序: select * from d_function where if_install='install' order by date desc; 5、条件筛选(case when)(1)作用:根据是否满足语句中的判断条件选取不同的取值,可以对数据进行重新分类、整理和命名。 (2)语法结构: CASE WHEN 条件1 THEN 结果1 WHEN 条件2 THEN 结果2 ELSE 默认结果 END (3)筛选成功交易和失败交易的所有订单创建时间和收货地址: select 订单创建时间,收货地址, case when 退款金额=0 then '成功交易' when 退款金额>0 then '失败交易' else '无效' end from 天猫订单;注意:这里的case…when筛选语句是在select下面的,因此筛选结果会将case…when的筛选结果新建一列进行显示。 (4)AS变量重命名 主要用于分组之后进行命名。 如将上面示例中case…when筛选的结果列命名为交易有效性,订单创建时间命名为 时间,收货地址命名为地址: select 订单创建时间 AS 时间,收货地址 AS 地址, case when 退款金额=0 then '成功交易' when 退款金额>0 then '失败交易' else '无效' end AS 交易有效性 from 天猫订单;1、主要工作 检查数据异常、使用代码进行数据清洗,也就是常用的增(insert)、删(delete)、改(update),其中insert较少使用,实际工作中是根据< CheckList >中的要求进行数据清洗。 2、update更新表中具体字段信息 (1)语法结构:update 表名 set 字段=‘更新内容’ where 条件; (2)用处:当数据非常多、不清楚正确值时,就可以使用delete将异常值删除 (3)操作步骤: |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |