哪个蜂巢表提供更好的性能?
Posted
技术标签:
【中文标题】哪个蜂巢表提供更好的性能?【英文标题】:which hive table gives better performance? 【发布时间】:2015-01-19 17:35:33 【问题描述】:我是 hadoop 的初学者。
内部表:该表存储在 Hive 仓库中,如果它被删除,则元数据和数据都将被删除。 外部表:该表存储在 hdfs 中,如果删除,则仅删除元数据。 现在,查询时哪个表的性能更好?请给出原因。
此外,如果您可以实时为这些表提供更多差异,那将是非常值得赞赏的。
提前致谢。
【问题讨论】:
【参考方案1】:内部表和外部表之间根本没有性能差异。唯一的区别就像你提到的 - 需要注意的一点是配置单元仓库也在 HDFS 中(路径不同)
【讨论】:
好的,谢谢....你能告诉我这些表格在实时场景中的更多区别吗? 在大多数情况下建议使用外部表 - 因为数据文件将进入每个用户的工作空间而不是共享的 Hive 仓库,集群管理员将获得诸如更容易管理 ACL 和 HDFS 配额的好处,如果集群由不同的用户共享。以上是关于哪个蜂巢表提供更好的性能?的主要内容,如果未能解决你的问题,请参考以下文章
哪个为与 Qlikview 的连接提供更好的性能?SQL 服务器或 SSAS Cube?
SSIS中 merge join与lookup 哪个性能更好些