R:连接到 Greenplum 数据库

Posted

技术标签:

【中文标题】R:连接到 Greenplum 数据库【英文标题】:R: Connect to Greenplum Database 【发布时间】:2017-09-01 18:16:40 【问题描述】:

首先我想说的是,我在 R 和 SQL 方面相对胜任,但对数据库连接/维护知之甚少。

在我的 Windows 计算机上,我在 SAS 和 Toad 中都连接到 Greenplum 数据库,它工作正常,我想在 R 中建立相同的连接。我的主要问题是确定我的实际名称是什么驱动程序/服务器/数据库。到目前为止,这是我的“工作”:

# Install RODBC
install.packages(“RODBC”)

# Create connection to database
connect <- odbcDriverConnect(connection="driver=
                              Greenplum;
                              server=“ServerName”;
                              database=“DataBase”;
                              trusted_connection=true")

我真的不知道在哪里可以找到我的服务器或数据库的名称(我可能可以弄清楚的数据库)。鉴于我在 Toad/SAS 中有一个连接,是否有一种简单的方法可以找到我所连接的服务器的名称?

【问题讨论】:

SAS 和 Toad 将使用您连接的主机名。数据库名称可以通过在 Toad 中运行获得:select current_database(); 【参考方案1】:

查看此参考指南:https://github.com/pivotalsoftware/gp-r/blob/master/HomePage.md#rpostgresql

DBNAME = 'marketing'
HOST   = '10.110.134.123'

# Create a driver
drv <- dbDriver( "PostgreSQL" )
# Create the database connection
con <- dbConnect( drv, dbname = DBNAME, host = HOST )

# Create the SQL query string. Include a semi-colon to terminate
querystring =   'SELECT countryname, income, babies FROM country_table;'
# Execute the query and return results as a data frame
countries   = dbGetQuery( con, querystring )

# Plot the results
plot( countries$income, countries$babies )

【讨论】:

不幸的是,我无法通过主机部分。上面的用户帮我找到了具体的数据库名,但是我找不到(或者不知道去哪里找)Host IP 或者服务器名。【参考方案2】:

Pivotal 还在 CRAN 中提供了 PivotalR 库。

【讨论】:

以上是关于R:连接到 Greenplum 数据库的主要内容,如果未能解决你的问题,请参考以下文章

如何从 Jupyter Notebook 中的 PySpark 远程连接到 Greenplum 数据库?

Greenplum数据库:psql:无法连接到服务器:没有这样的文件或目录

无法从 Windows 上的 pgadmin 连接到 greenplum postgresql

我们的 GCP docker 实例已启动并正在运行,但是我们无法连接到 GreenPlum

Greenplum 并行下载转储到本地集群

管理使用Greenplum集群