有没有办法在BigQuery Standard SQL中解析XML标签?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有没有办法在BigQuery Standard SQL中解析XML标签?相关的知识,希望对你有一定的参考价值。

我读过它是一个bad idea to parse XML/HTML using regular expressions。另一种建议是使用XML解析器。 BigQuery Standard SQL库中是否存在一个?

答案

以下是如Elliot所提到的如何在BigQuery中使用javascript UDF的文档。

https://cloud.google.com/bigquery/docs/reference/standard-sql/user-defined-functions

我想UDF可能看起来像

CREATE TEMPORARY FUNCTION XML(x STRING)
RETURNS STRING
  LANGUAGE js AS """
  var data = fromXML(x);
  return data.title;
"""
OPTIONS(
library="gs://<BUCKET_NAME>/from-xml.min.js"
);
SELECT XML(a) FROM UNNEST(["<title>Title of Page</title>"]) as a

from-xml.min.js来自this库并加载到您的gcs帐户

以上是关于有没有办法在BigQuery Standard SQL中解析XML标签?的主要内容,如果未能解决你的问题,请参考以下文章

Bigquery (Standard Sql) - 年月日期格式

使用外部 UDF 库运行 BigQuery Standard SQL

在BigQuery Standard SQL中的Last Slash之后获取字符串

在 bigquery Standard sql 中按问题分组,并且无法获取唯一记录

Bigquery Standard Sql 等效于 Legacy Sql 中的 LAST()

PARSE_DATE : 解析函数 BigQuery/Standard SQL 的结果无效