使用 Dask 库连接到 Impala DB

Posted

技术标签:

【中文标题】使用 Dask 库连接到 Impala DB【英文标题】:Connecting to Impala DB using Dask Library 【发布时间】:2021-11-09 09:05:56 【问题描述】:

我正在尝试通过 Dask 库连接到 Impala DB,以使用 read_sql_table() 从表中获取所有数据。需要连接字符串来连接,我已经尝试使用我通常在 Dbeaver 中连接的连接字符串,但它失败说无法加载插件:'impala'。

谁能帮助我,或者让我知道 Dask 是否支持 Impala 连接?谢谢。

【问题讨论】:

【参考方案1】:

Dask 的 read_sql_table 使用它的 pandas 版本来获取单个数据块。因此,如果您的 URI(连接字符串)适用于 pandas,它也应该适用于 dask。 我发现 this 教程告诉我,impala 的 URI 应该看起来像这样 apacheimpala:///?Server=127.0.0.1&Port=21050 我无法对此进行任何验证,因为您没有发布一个最小的工作示例,而且我没有任何 impala DB 飞来飞去。

【讨论】:

以上是关于使用 Dask 库连接到 Impala DB的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 sapnwrfc 库连接到 SAP?

无法使用 pyodbc 库连接到 Azure 数据库

使用开源 xmpp 库连接到 nimbuzz 聊天

无法将 Github 组织存储库连接到 AWS Amplify 应用程序

在端口 443 上使用 ALPN 将 M2MQTT 客户端库连接到 AWS IoT 时出现问题

无法使用 Java SocketFactory 库连接到 Cloud SQL