数据分析进阶 |
您所在的位置:网站首页 › navicat添加列 › 数据分析进阶 |
1. 背景与目的 数据分析中处理十万以内数据基础工具基于Excel,而针对十万以上超出在数据库的数据需要使用SQL提取。 2. 步骤 本篇为入门阶段介绍 1) 什么是数据库 数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。 相比Excel,数据库存放更多的数据。可多人同时访问 类似网盘 数据库分为数据库共有3种类型,为关系数据库、非关系型数据库和键值数据库。最常见数据库为关系数据库 关系数据库=多张表+各表之间的关系 表的结构包含:列名+行名+表名 主键:用来表示数据唯一性的列(如下:学号列) 主键是关系数据库的重要概念 ,他代表了关系数据库的唯一性。 各表之间关系通过唯一性主键数据列(主键)及联结join语句处理。 如下举例: 什么是数据库管理系统(数据库管理人员) 这是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库(关系数据库管理系统:mysql,oracle,sql server) 什么是SQL 用于操作(访问及处理)数据库里面数据的标准计算机语言 SQL 分类 DDL(Data Definition Language,数据定义语言) DML(Data Manipulation Language,数据操纵语言)--90%以上 DCL(Data Control Language,数据控制语言)--外加 ‘REVOKE: 取消用户的操作权限 2)如何安装mysql数据库和可视化客户端navicat 数据库安装分为俩部分: a) MySQL数据库(存放数据) b) 客户端Navicat (通过客户端,方便操作数据库) 如何验证MySQL数据库安装成功? 打开cmd,按如下步骤操作,显示 server version:5.7.28,安装成功。 如何用客户端(Navicat)连接到MySQL数据库? 第一步 打开Navicat 第二步 连接MySQL 3)表的创建,删除和更新 数据类型分为三种:字符串,数字及日期 第一种:字符串 CHAR 是用来指定存储字符串的列 的数据类型(字符型)。 Varchar 字符类型可以覆盖所有数据类型的长度,不满十个字符串长度(比如三个或四个)也都自动保存原始字符串大小,避免重复数据处理。 Text (微信类文字类文本数据类型) Blob (视频或图片类数据类型) 第二种:数字 MySQL有上图黄色段的四种数字类型数据,整数型数据。 INTEGER型 用来指定存储整数的列的数据类型(数字型),不能存储小数。 一个字符=3-4个字节 灰色两种为浮点数据 (eg:余额宝日收益为1.3元) 第三种:日期 如下举例: 上图学号为字符串类型而非数字类型(因为数字类一般不以0开头)。 每种类型数据设置固定后, 后续对应数据都得按实际设置的数据类型匹配 长度255为默认值 标3的钥匙行表示为此数据表里的主键数据。 非null表示不可以包含空值为:意为必须输入数据的原数 按实际业务看,如果某一列数据可以有空值,则此处可以没有这个约束(无需打勾) 主键:用来定位某一行数据唯一性的列。选取跟业务关联性较低的字段。表格设定后不要随意 修改主键。 哪一列数据为主键的意思为 不能添加重复的数据列(比如两组学号值)否则会报错。 联合主键:通过多个字段(即两个或更多的字段都设置为主键)设置为唯一标识记录。联合主键中字段允许有重复(不能全部重复)。 联合主键即为固定某行数据,比如上述显示课程表里 学号和课程号联合主键即为 同一个学生只会在一门课上有一个记录。 实战: a) 使用Navicat创建学校数据库 第一步:双击Navicat打开,右击数据库名da 新建数据库,填写数据库名称,字符集及排序规则如下。 第二步:打开数据库 创建数据库的CREATE DATABASE语句 CREATE DATABASE 数据库名称;--CREATE DATABASE shop; b) 将上图四张表创建出来,表名为图中英文名称。将学生表学号列设置为主键,课程表学号课程号一起设置为联合主键,成绩表的课程号教师号一起设置为主键,教师表的教师号设置为主键元素,教师姓名这列设置为NULL(允许空值) 第一步,右击表,新建表 依次将学生表四个字段添加,鼠标移至学号列右端单击设置为主键。 保存,输入表名即可。 接下来,按照以上步骤分别创建其余三个表。 Course Score Teacher 语法1-2 创建表的CREATE TABLE语句 至此,上述四张表格创建完毕。 表的更新删除如下操作 删除表时使用的DROP TABLE语句DROP TABLE 表名;--DROP TABLE Product; 添加/删除列的ALTER TABLE语句ALTER TABLE ADD /DROP COLUMN ;--ALTER TABLE Product ADD/DROP COLUMN product_name_pinyin VARCHAR(100); 修改表名 4) 数据的插入,删除及更新 若数据较多,使用sql语句批量插入数据 注意:列名不能加引号,数值需加引号表示为字符串的常数,语句结尾用分号结束。 且所有符号需在英文状态下操作。 l 列名不加引号,数据加引号。 l 关键字为蓝色字部分 不区分大小写,表名或列名也不区分大小 为了 理解起来更加容易,本书使用以下规则来书写 SQL 语句。 ● 关键字大写 ● 表名的首字母大写 ● 其余(列名等)小写 l 插入表中数据区分大小写。例如,在操作过程中,数据 Computer、COMPUTER 或 computer,三者是不一样的。 l 常数(SQL三种数据类型)固定的书写方式 字符串和日期常数需要使用单引号(')括起来。 数字常数无需加注单引号(直接书写数字即可)。 l 单词之间需要用半角空格或者换行来分隔 数据库名称、表名和列名等可以使用以下三种字符。 ● 半角英文字母 ● 半角数字 ● 下划线(_)名称必须以半角英文字母作为开头。举例: 将上述学校数据库里四张表里数据插入。 注意:教师表里 有一个空值null(没有数据,不可用于计算)及空字符串(”‘):即为空字符串数据,可参与计算。 学生表 成绩表 教师表 至此,相关表格建立及数据插入在数据库完成。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |