dbeaver导入excel数据 |
您所在的位置:网站首页 › dbeaver怎么导入csv文件 › dbeaver导入excel数据 |
![]() 数据来源:阿里巴巴天池 User Behavior Data from Taobao for Recommendation-数据集-阿里云天池tianchi.aliyun.com![]() 1.新建一个数据库→导入向导→导入类型(和excel文件类型一致) ![]() ![]() 2.Excel 文件的位置→下一步 ![]() ![]() 3.为源定义一些附加的选项 如果excel数据量大,可以在下面的界面设置分批导入。“第一个数据行”和“最后一个数据行”设置导入哪个范围的数据。 字段名行:1→字段名在第1行 第一个数据行:2→从第2行导入数据 最后一个数据行:10000→导入到第10000行数据结束 ![]() 因为这个Excel数据很大,所以只导入10万条数据用来练习。 如果要分批导入100万行数据,第1次导入: 第一个数据行:2(表示从第2行开始导入数据,因为第1行是列字段名) 最后一个数据行:500000(表示导入到第500000行结束) 第2次导入: 第一个数据行:500001 最后一个数据行:1000000 4.选择目标表 新数据库表里导入数据,在“新建表”打钩;已有的数据库表里导入数据,不需要打钩。 ![]() ![]() 5.选择导入模式 ![]() 6.点击“开始”按钮执行导入 ![]() 7.导入成功 ![]() ![]() 8.修改列名:设计表 ![]() 将列名均设置成“不是null” ![]() ![]() 9.把时间戳改为日期和时间的格式 (1).增加一列用于存放日期: alter table userbehavior add 日期 varchar(255);![]() (2)从时间戳里抽取日期: update userbehavior set 日期=from_unixtime(时间戳,'yyyy-mm-dd');![]() (3)增加一列用于存放时间: alter table userbehavior add 时间 varchar(255);(4)从时间戳里抽取时间: update userbehavior set 时间=from_unixtime(时间戳,'%H:%i:%s');![]() 10.数据处理 (1)删除缺失值 delete from 表名 where 列名 is null;(2)填充缺失值 select coalesce(列名, 要填充的值) from 表名;(3)删除重复值 ①先创建一个临时表,用于保存要删除的重复值 create table 表名1 as select 列名 as 列名1 from表名;②删除重复值 delete from 表名 where 列名 in(select 列名1 from表名1 group by 列名1 having count(列名1)>1); |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |