如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误?

Posted

技术标签:

【中文标题】如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误?【英文标题】:How to figure out proper xpath for IMPORTXML in Google Sheets - N/A Error? 【发布时间】:2020-05-09 06:19:59 【问题描述】:

我正在尝试在 Google 表格上使用 IMPORTXML 功能。

例如:=IMPORTXML("https://www.tiktok.com/@charlidamelio?lang=en", XMLPATH) 应该返回“54.3M”

我使用 Chrome 检查器复制 xpath,这给了我:

/html/body/div[1]/div/div[2]/div/div[1]/div/header/h2[1]/strong[2]

当我在 Google 表格中尝试此操作时,它返回错误:#N/A(导入内容为空)。

附:我愿意通过其他方式将我需要的数据放入谷歌表格,它不必使用 IMPORTXML 函数。

【问题讨论】:

【参考方案1】:

这个答案怎么样?

在此答案中,使用了 IMPORTXMLREGEXEXTRACT。而且,它假设https://www.tiktok.com/@charlidamelio?lang=en的URL被放在单元格“A1”中。

模式一:

在此模式中,检索“followerCount”。

示例公式:

=REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)")
“followerCount”是从脚本中检索到的。 在这种情况下,当使用=VALUE(REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)"))时,检索到的值可以作为数字。

结果:

模式 2:

在此模式中,检索“followerCount”。

示例公式:

=REGEXEXTRACT(IMPORTXML(A1,"//meta[@name='description']/@content")," ([\w\d.]+) Fans")
从元数据中检索到“54.4M Fans”的值。

结果:

参考资料:

IMPORTXML REGEXEXTRACT

【讨论】:

非常感谢!这正是我所需要的。 @ConfuciusCat 感谢您的回复。很高兴您的问题得到解决。 嗨@Tanaike,我非常感谢您之前的帮助,您的解决方案工作了一个多月,但现在它不再工作了。你知道为什么会这样吗? =REGEXEXTRACT(IMPORTXML(A1,"//script[@id='NEXT_DATA']"),"followerCount"":(\d+)") @ConfuciusCat 感谢您的回复。现在我注意到your previous question 与此有关。所以我想评论your previous question。请检查一下。

以上是关于如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误?的主要内容,如果未能解决你的问题,请参考以下文章

Google 表格 ImportXML - 提取类信息

Google 表格——ImportXML 函数。接收错误?

如何在 Google 脚本中使用 ImportXML?

在Google表格上更正= IMPORTXML的路径

使用 Importxml 函数时,在 Google 表格中包含单元格引用以形成 URL

Google 表格:=importxml 未加载某些结果