是否可以在 ElasticSearch 中使用 presto 或 Hive (ElasticSearch-Hadoop) 的任何 ES 连接器进行 JOIN 操作?
Posted
技术标签:
【中文标题】是否可以在 ElasticSearch 中使用 presto 或 Hive (ElasticSearch-Hadoop) 的任何 ES 连接器进行 JOIN 操作?【英文标题】:Is JOIN operation possible in ElasticSearch using any ES Connector for presto or Hive (ElasticSearch-Hadoop)? 【发布时间】:2015-08-13 22:30:52 【问题描述】:我们知道 ElasticSearch 中的索引之间无法进行 JOIN 操作,是否可以使用 Presto 或 Hive 来实现,即我们可以使用任何 ElasticSearch Connector for Presto 或 Hive 进行 JOIN 操作吗?
我们可以使用 ElasticSearch-Hadoop - https://github.com/elastic/elasticsearch-hadoop 在 ElasticSearch 中进行 JOIN 吗?
【问题讨论】:
【参考方案1】:是的,如果您为 Presto 编写 ElasticSearch 的连接器,您可以使用它来执行 JOIN。 Presto 中的 JOIN 是在核心引擎内部处理的,不涉及连接器,除了读取底层数据。
【讨论】:
有人写过这样的连接器吗?任何有助于编写此类连接器的链接都会有所帮助。 我不知道 ElasticSearch 连接器,但请看一下 jdbc 连接器和示例 http 连接器。它们都在主 presto 存储库中【参考方案2】:有一个 Hive ElastiSearch connector。
Presto 可以在 Hive 元存储上运行
更新
这个doesn't work
【讨论】:
以上是关于是否可以在 ElasticSearch 中使用 presto 或 Hive (ElasticSearch-Hadoop) 的任何 ES 连接器进行 JOIN 操作?的主要内容,如果未能解决你的问题,请参考以下文章
是否可以在 Elasticsearch 中获取 copy_to 字段的内容?
Elasticsearch中Text和Keyword类型的区别
是否可以使用 FSCrawler 将文件内容插入 Elasticsearch 中现有索引的特定 _id