如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误？

Posted 2023-04-14

技术标签:

【中文标题】如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误？【英文标题】：How to figure out proper xpath for IMPORTXML in Google Sheets - N/A Error? 【发布时间】：2020-05-09 06:19:59 【问题描述】：

我正在尝试在 Google 表格上使用 IMPORTXML 功能。

例如：=IMPORTXML("https://www.tiktok.com/@charlidamelio?lang=en", XMLPATH) 应该返回“54.3M”

我使用 Chrome 检查器复制 xpath，这给了我：

/html/body/div[1]/div/div[2]/div/div[1]/div/header/h2[1]/strong[2]

当我在 Google 表格中尝试此操作时，它返回错误：#N/A（导入内容为空）。

附：我愿意通过其他方式将我需要的数据放入谷歌表格，它不必使用 IMPORTXML 函数。

【问题讨论】：

【参考方案1】：

这个答案怎么样？

在此答案中，使用了 IMPORTXML 和 REGEXEXTRACT。而且，它假设https://www.tiktok.com/@charlidamelio?lang=en的URL被放在单元格“A1”中。

模式一：

在此模式中，检索“followerCount”。

示例公式：

=REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)")

“followerCount”是从脚本中检索到的。在这种情况下，当使用=VALUE(REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)"))时，检索到的值可以作为数字。

结果：

模式 2：

在此模式中，检索“followerCount”。

示例公式：

=REGEXEXTRACT(IMPORTXML(A1,"//meta[@name='description']/@content")," ([\w\d.]+) Fans")

从元数据中检索到“54.4M Fans”的值。

结果：

参考资料：

IMPORTXML REGEXEXTRACT

【讨论】：

非常感谢！这正是我所需要的。 @ConfuciusCat 感谢您的回复。很高兴您的问题得到解决。嗨@Tanaike，我非常感谢您之前的帮助，您的解决方案工作了一个多月，但现在它不再工作了。你知道为什么会这样吗？ =REGEXEXTRACT(IMPORTXML(A1,"//script[@id='NEXT_DATA']"),"followerCount"":(\d+)") @ConfuciusCat 感谢您的回复。现在我注意到your previous question 与此有关。所以我想评论your previous question。请检查一下。

以上是关于如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误？的主要内容，如果未能解决你的问题，请参考以下文章

Google 表格 ImportXML - 提取类信息

Google 表格——ImportXML 函数。接收错误？

如何在 Google 脚本中使用 ImportXML？

在Google表格上更正= IMPORTXML的路径

使用 Importxml 函数时，在 Google 表格中包含单元格引用以形成 URL

Google 表格：=importxml 未加载某些结果