在greenplum数据库中,我们可以从查询条件中转储表吗
Posted
技术标签:
【中文标题】在greenplum数据库中,我们可以从查询条件中转储表吗【英文标题】:In greenplum database, can we Dump Table from query condition 【发布时间】:2020-02-13 13:51:57 【问题描述】:我正在使用 Greenplum 数据库。是否可以使用 gpbackup 实用程序中的 where 子句或某种方法从表中转储数据。因为我不想导出整个数据,而只想导出其中的一部分
【问题讨论】:
【参考方案1】:是的。有一个名为 minirepro 的实用程序—— 提供查询,它将转储所有涉及的表的 DDL 和统计信息。
https://community.pivotal.io/s/article/How-to-Collect-DDL-and-Statistics-Information-Using-the-Minirepro-Utility
【讨论】:
【参考方案2】:gpbackup 支持表级备份。您要求的实际上不是“备份”而是转储。您可以将PXF与外部可写表一起使用,将数据导出到s3、Hadoop、hive、Jdbc目标等。例如,
创建可写的外部表 ext_to_s3(like internal_table) location('pxf://aws-s3-gpdb-dump?profile=s3') format 'csv';
insert into ext_to_s3 select * from internal_table where a>100;
【讨论】:
以上是关于在greenplum数据库中,我们可以从查询条件中转储表吗的主要内容,如果未能解决你的问题,请参考以下文章
使用 gp_segment_id 作为分区列从 greenplum 中并行获取数据
从Greenplum上的表中读取数据时,如何在Spark-jdbc应用程序的选项“dbtable”中指定子查询? [复制]