哪个蜂巢表提供更好的性能?

Posted

技术标签:

【中文标题】哪个蜂巢表提供更好的性能?【英文标题】:which hive table gives better performance? 【发布时间】:2015-01-19 17:35:33 【问题描述】:

我是 hadoop 的初学者。

内部表:该表存储在 Hive 仓库中,如果它被删除,则元数据和数据都将被删除。 外部表:该表存储在 hdfs 中,如果删除,则仅删除元数据。 现在,查询时哪个表的性能更好?请给出原因。

此外,如果您可以实时为这些表提供更多差异,那将是非常值得赞赏的。

提前致谢。

【问题讨论】:

【参考方案1】:

内部表和外部表之间根本没有性能差异。唯一的区别就像你提到的 - 需要注意的一点是配置单元仓库也在 HDFS 中(路径不同)

【讨论】:

好的,谢谢....你能告诉我这些表格在实时场景中的更多区别吗? 在大多数情况下建议使用外部表 - 因为数据文件将进入每个用户的工作空间而不是共享的 Hive 仓库,集群管理员将获得诸如更容易管理 ACL 和 HDFS 配额的好处,如果集群由不同的用户共享。

以上是关于哪个蜂巢表提供更好的性能?的主要内容,如果未能解决你的问题,请参考以下文章

性能方面:在 Laravel 数据库中哪个更好

哪个为与 Qlikview 的连接提供更好的性能?SQL 服务器或 SSAS Cube?

SSIS中 merge join与lookup 哪个性能更好些

哪个更好?在 MySQL 中的磁盘文件或临时表中缓存

SAP ABAP语法 Select single 和 FOR ALL ENTRIES IN 到底哪个性能更好

哪个查询有更好的性能?