使用 SIMba JDBC 驱动程序访问特定 Google bigquery 数据集的元数据

Posted

技术标签:

【中文标题】使用 SIMba JDBC 驱动程序访问特定 Google bigquery 数据集的元数据【英文标题】:Accessing Metadata of specific Google bigquery dataset using SImba JDBC Driver 【发布时间】:2019-05-02 08:05:07 【问题描述】:

这是我到目前为止所做的: 我们在 Teiid WildFly 服务器中使用 Simba Google BigQuery JDBC 驱动程序(版本 41_1.2.0.1)连接到 bigequery。 我们正在使用以下连接 URL。 jdbc:bigquery://https://www.googleapis.com/bigquery/v2:443;OAuthType=2;ProjectId=xyz

这是我正在寻找的: 我们需要使用 connectionURL 连接到特定的数据集并仅获取该数据集的元数据。

为了实现上述目标,我还尝试使用可用的 DefaultDataset 参数,即使在连接 URL 中使用它之后,驱动程序也会获取提到的项目中所有可用数据集的元数据。

上面的问题: 这确实减慢了通过 Teiid 部署 VBD 的过程。 我认为这主要是由于多个数据集,因为当我尝试连接到一个只有一个数据集的项目时,我们只需几秒钟即可完成。

谢谢

【问题讨论】:

请向我们展示代码以及您认为问题所在的位置。 【参考方案1】:

在为 JDBC 驱动程序构建连接 URL 的 documentation 中,连接 URL 的格式为:

jdbc:bigquery://[Host]:[Port];ProjectId=[Project];OAuthType=[AuthValue];[Property1]=[Value1];[Property2]=[Value2];...

查看configuration parameters 的选项,无法仅连接到单个数据集。 DefaultDataset 仅预填充对该数据集中表的引用,因此您可以在代码中使用不合格的表名。其余数据集仍可访问。

【讨论】:

以上是关于使用 SIMba JDBC 驱动程序访问特定 Google bigquery 数据集的元数据的主要内容,如果未能解决你的问题,请参考以下文章

bigquery Simba JDBC 驱动程序是不是支持批量查询?

通过 Simba JDBC 的 Databricks Spark 连接问题

授予 Simba ODBC 驱动程序或 bigrquery 访问 Google Drive 文件的权限

maven repo中的Athena JDBC Driver 2.0.7?

用于 Google BigQuery 的 Simba ODBC 驱动程序看不到共享数据集

无法使用 Impala JDBC 驱动程序通过 Java 应用程序连接到 Impala