数据分析进阶

您所在的位置:网站首页 navicat添加列 数据分析进阶

数据分析进阶

2023-03-15 06:44| 来源: 网络整理| 查看: 265

1. 背景与目的

数据分析中处理十万以内数据基础工具基于Excel,而针对十万以上超出在数据库的数据需要使用SQL提取。

2. 步骤

 本篇为入门阶段介绍

1) 什么是数据库

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。

相比Excel,数据库存放更多的数据。可多人同时访问 类似网盘

数据库分为数据库共有3种类型,为关系数据库、非关系型数据库和键值数据库。最常见数据库为关系数据库

关系数据库=多张表+各表之间的关系

表的结构包含:列名+行名+表名

主键:用来表示数据唯一性的列(如下:学号列)

主键是关系数据库的重要概念 ,他代表了关系数据库的唯一性。

各表之间关系通过唯一性主键数据列(主键)及联结join语句处理。

如下举例:

什么是数据库管理系统(数据库管理人员)

这是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库(关系数据库管理系统:mysql,oracle,sql server)

什么是SQL

用于操作(访问及处理)数据库里面数据的标准计算机语言

SQL 分类

DDL(Data Definition Language,数据定义语言)

DML(Data Manipulation Language,数据操纵语言)--90%以上

DCL(Data Control Language,数据控制语言)--外加 ‘REVOKE: 取消用户的操作权限

2)如何安装mysql数据库和可视化客户端navicat

数据库安装分为俩部分:

a) MySQL数据库(存放数据)

b) 客户端Navicat (通过客户端,方便操作数据库)

如何验证MySQL数据库安装成功?

打开cmd,按如下步骤操作,显示 server version:5.7.28,安装成功。

如何用客户端(Navicat)连接到MySQL数据库?

第一步 打开Navicat

第二步 连接MySQL

3)表的创建,删除和更新

数据类型分为三种:字符串,数字及日期

第一种:字符串

CHAR 是用来指定存储字符串的列 的数据类型(字符型)。

Varchar 字符类型可以覆盖所有数据类型的长度,不满十个字符串长度(比如三个或四个)也都自动保存原始字符串大小,避免重复数据处理。

Text (微信类文字类文本数据类型)

Blob (视频或图片类数据类型)

第二种:数字

MySQL有上图黄色段的四种数字类型数据,整数型数据。

INTEGER型 用来指定存储整数的列的数据类型(数字型),不能存储小数。

一个字符=3-4个字节

灰色两种为浮点数据 (eg:余额宝日收益为1.3元)

第三种:日期

如下举例:

上图学号为字符串类型而非数字类型(因为数字类一般不以0开头)。

每种类型数据设置固定后, 后续对应数据都得按实际设置的数据类型匹配

长度255为默认值

标3的钥匙行表示为此数据表里的主键数据。

 非null表示不可以包含空值为:意为必须输入数据的原数

 按实际业务看,如果某一列数据可以有空值,则此处可以没有这个约束(无需打勾)

主键:用来定位某一行数据唯一性的列。选取跟业务关联性较低的字段。表格设定后不要随意 修改主键。

哪一列数据为主键的意思为 不能添加重复的数据列(比如两组学号值)否则会报错。

联合主键:通过多个字段(即两个或更多的字段都设置为主键)设置为唯一标识记录。联合主键中字段允许有重复(不能全部重复)。

联合主键即为固定某行数据,比如上述显示课程表里 学号和课程号联合主键即为 同一个学生只会在一门课上有一个记录。

实战:

a) 使用Navicat创建学校数据库

第一步:双击Navicat打开,右击数据库名da 新建数据库,填写数据库名称,字符集及排序规则如下。

第二步:打开数据库

创建数据库的CREATE DATABASE语句

CREATE DATABASE 数据库名称;--CREATE DATABASE shop;

b) 将上图四张表创建出来,表名为图中英文名称。将学生表学号列设置为主键,课程表学号课程号一起设置为联合主键,成绩表的课程号教师号一起设置为主键,教师表的教师号设置为主键元素,教师姓名这列设置为NULL(允许空值)

第一步,右击表,新建表

依次将学生表四个字段添加,鼠标移至学号列右端单击设置为主键。

保存,输入表名即可。

接下来,按照以上步骤分别创建其余三个表。

Course

Score

Teacher

语法1-2 创建表的CREATE TABLE语句

至此,上述四张表格创建完毕。

表的更新删除如下操作

删除表时使用的DROP TABLE语句

DROP TABLE 表名;--DROP TABLE Product;

添加/删除列的ALTER TABLE语句

ALTER TABLE ADD /DROP COLUMN ;--ALTER TABLE Product ADD/DROP COLUMN product_name_pinyin VARCHAR(100);

修改表名

4) 数据的插入,删除及更新

若数据较多,使用sql语句批量插入数据

注意:列名不能加引号,数值需加引号表示为字符串的常数,语句结尾用分号结束。

且所有符号需在英文状态下操作。

l 列名不加引号,数据加引号。

l 关键字为蓝色字部分 不区分大小写,表名或列名也不区分大小

为了 理解起来更加容易,本书使用以下规则来书写 SQL 语句。

● 关键字大写 ● 表名的首字母大写 ● 其余(列名等)小写

l 插入表中数据区分大小写。例如,在操作过程中,数据 Computer、COMPUTER 或 computer,三者是不一样的。

l 常数(SQL三种数据类型)固定的书写方式

字符串和日期常数需要使用单引号(')括起来。

数字常数无需加注单引号(直接书写数字即可)。

l 单词之间需要用半角空格或者换行来分隔

数据库名称、表名和列名等可以使用以下三种字符。 ● 半角英文字母  ● 半角数字  ● 下划线(_)名称必须以半角英文字母作为开头。

举例:

将上述学校数据库里四张表里数据插入。

注意:教师表里 有一个空值null(没有数据,不可用于计算)及空字符串(”‘):即为空字符串数据,可参与计算。

学生表

 成绩表

 教师表

至此,相关表格建立及数据插入在数据库完成。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3