如何将 presto 集群集成到 hadoop 集群?

Posted

技术标签:

【中文标题】如何将 presto 集群集成到 hadoop 集群?【英文标题】:How do I integrate presto cluster to hadoop cluster? 【发布时间】:2019-09-08 15:44:42 【问题描述】:

我们有基于 ambari 的 Hadoop 集群 由于 thrift 服务器性能不佳,我们决定用 presto 替换它 我们当前的 Hadoop 集群有以下机器 960台数据节点机器(基于redhat 7 OS)

关于 presto- 的几句话 Presto(或 PrestoDB)是一个开源的分布式 SQL 查询引擎,从头开始设计用于对任何大小的数据进行快速分析查询。它支持非关系源,例如 Hadoop 分布式文件系统 (HDFS),

我们安装了新的 presto 服务器如下 首先我们安装了操作系统(redhat 7),一共13台机器 1 台用于 presto 协调器的机器 还有 12 台机器供 presto 工人使用

安装操作系统后 我们成功安装了 presto(presto coordinator + presto workers)

现在我们被困在如何在 presto 集群和 Hadoop 集群之间进行集成

我将给出关于 hive 连接器 (hive.properties) 的简短示例

我们有以下变量 hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml

由于这个文件位于数据节点机器上,当然不在 presto worker 机器上,我假设我们需要将这些文件从数据节点机器复制到 presto worker 机器

我在吗?

【问题讨论】:

【参考方案1】:

您通常不需要配置 hive.config.resources 以允许 Presto 与您的 HDFS 集群通信。尝试在没有该配置的情况下使用 Presto。仅当您有 Hadoop KMS 等特殊要求时才配置它。

要对其进行配置,请将适当的 Hadoop 配置文件复制到您的 Presto 机器(协调器和工作器),然后将 hive.config.resources 设置为指向这些文件。

有关详细信息,请参阅Hive connector documentation。

【讨论】:

以上是关于如何将 presto 集群集成到 hadoop 集群?的主要内容,如果未能解决你的问题,请参考以下文章

presto集成kerberos以及访问集成了kerberos的hive集群

hadoop2.0中加入全新的集群资源管理器,下面哪个不是yarn中的组件

presto + Hive 安全配置

关于 Hadoop 和 Hive 和 Presto 的问题

spark集群安装并集成到hadoop集群

HBase集群安装及集成