2.2.2Hive创建索引

您所在的位置:网站首页 hive创建不了表的原因 2.2.2Hive创建索引

2.2.2Hive创建索引

2023-12-09 22:43| 来源: 网络整理| 查看: 265

Hive创建索引

一、       意义

        索引是标准的数据库技术,用户可以在某些列上创建索引来加速某些操作,给一个表创建的索引数据被保存在另外的表中。 用户可以使用EXPLAIN语法来分析HiveQL语句是否可以使用索引来提升用户查询的性能。索引需要更多的磁盘空间,并且创建维护索引也会有一定的代价。用户必须要权衡从索引得到的好处和代价。

二、       创建一张表

            创建:

create table t_user(id int, namestring) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

            导入数据:

三、       创建索引之前测试

select * from t_user where id = 0053;

select * from t_user where id < 0053 and id > 0010order by id limit 10;

                开始走MapReduce

            总共需要42秒多。

二、       对表创建索引

            创建:

create index user_index on table t_user(id) as'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' with deferredrebuild in table user_index_table;

                 修改:

alter index user_indexon t_user rebuild;

                 查询:

select * fromuser_index_table limit 5;

                创建成功。

三、      创建索引后再查询

                查询语句:

select * from t_user where id < 0053 and id > 0010order by id limit 10;

                效果不明显。可能是由于数据还不够多。

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3