HiveQL：索引

Posted 2021-04-29 大数据DL

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了HiveQL：索引相关的知识，希望对你有一定的参考价值。

一、创建索引

二、使用索引

Hive支持索引，但是Hive的索引与关系型数据库中的索引并不相同，比如，Hive不支持主键或者外键。hive索引比较麻烦，而且有些文件格式不支持，所以不常用，但是它确实提高查询速度。Hive的索引目的是提高Hive表指定列的查询速度。没有索引时，类似'WHERE tab1.col1 = 10' 的查询，Hive会加载整张表或分区，然后处理所有的rows，但是如果在字段col1上面存在索引时，那么只会加载和处理文件的一部分。与其他传统数据库一样，增加索引在提升查询速度时，会消耗额外资源去创建索引和需要更多的磁盘空间存储索引。Hive 0.7.0版本中，加入了索引。Hive 0.8.0版本中增加了bitmap索引。

一、创建索引

HiveQL：索引