使用 Dask 库连接到 Impala DB
Posted
技术标签:
【中文标题】使用 Dask 库连接到 Impala DB【英文标题】:Connecting to Impala DB using Dask Library 【发布时间】:2021-11-09 09:05:56 【问题描述】:我正在尝试通过 Dask 库连接到 Impala DB,以使用 read_sql_table() 从表中获取所有数据。需要连接字符串来连接,我已经尝试使用我通常在 Dbeaver 中连接的连接字符串,但它失败说无法加载插件:'impala'。
谁能帮助我,或者让我知道 Dask 是否支持 Impala 连接?谢谢。
【问题讨论】:
【参考方案1】:Dask 的 read_sql_table
使用它的 pandas 版本来获取单个数据块。因此,如果您的 URI(连接字符串)适用于 pandas,它也应该适用于 dask。
我发现 this 教程告诉我,impala 的 URI 应该看起来像这样 apacheimpala:///?Server=127.0.0.1&Port=21050
我无法对此进行任何验证,因为您没有发布一个最小的工作示例,而且我没有任何 impala DB 飞来飞去。
【讨论】:
以上是关于使用 Dask 库连接到 Impala DB的主要内容,如果未能解决你的问题,请参考以下文章
无法将 Github 组织存储库连接到 AWS Amplify 应用程序