如何使用 gpload 实用程序?

Posted

技术标签:

【中文标题】如何使用 gpload 实用程序?【英文标题】:How to use gpload utility? 【发布时间】:2021-11-17 14:32:33 【问题描述】:

我在下面有 YAML 文件:

---
VERSION: 1.0.0.1
DATABASE: xxx
USER: xxx
HOST: xxx
PORT: 5432
GPLOAD:
   INPUT:
    - SOURCE:
         LOCAL_HOSTNAME: 
           - 192.168.0.21
         PORT: 8081
         FILE: 
           - /home/root/test_input.txt
    - COLUMNS:
           - age: int4
           - name: varchar
           - surname: varchar
    - FORMAT: text
    - DELIMITER: '|'
    - ERROR_LIMIT: 2
    - LOG_ERRORS: true
   OUTPUT:
    - TABLE: sf_dfs.test_gpload
    - MODE: INSERT
   PRELOAD:
    - REUSE_TABLES: true

但我收到一个错误:连接到 gpfdist http://192.168.0.21:8081//home/root/test_input.txt 时出错,尝试 11 次后退出 (seg0 slice1 192.168.0.23:6000 pid=2021845) 运行 INSERT INTO 时遇到

也许有人对这个程序有经验?

【问题讨论】:

【参考方案1】:

看起来是端口问题。如果数据库已启动,请使用不同的端口重新运行作业。确保防火墙没有阻止此端口。

【讨论】:

您的答案可以通过额外的支持信息得到改进。请edit 添加更多详细信息,例如引用或文档,以便其他人可以确认您的答案是正确的。你可以找到更多关于如何写好答案的信息in the help center。 是的。我忘了禁用我的防火墙...谢谢!【参考方案2】:

几个问题:

您是否以 root 身份运行 gpload? root 一般没有数据库的访问权限。它需要以 gpadmin 或超级用户身份运行。

输入文件在 /home/root 中。如果您以 gpadmin 身份运行,gpadmin 可以访问此文件吗?文件的权限?

最后,目标表是否存在于数据库中(sf_dfs.test_gpload)?它是否创建并分布在所有细分市场中?该错误似乎表明该表不存在。

【讨论】:

以上是关于如何使用 gpload 实用程序?的主要内容,如果未能解决你的问题,请参考以下文章

Greenplum gpload - 最后一个错误:最后一个预期列之后的额外数据

GreenPlum数据的装载与卸载之gpload的使用

GreenPlum 使用gpload通过gpfdist文件实现数据高速加载

基于windows测试gpload时出错

gpfdist vs gpload greenplum

发生 gpload 控制文件处理错误。条目必须是 YAML 序列