Google 表格 ImportXML - 提取类信息

Posted

技术标签:

【中文标题】Google 表格 ImportXML - 提取类信息【英文标题】:Google Sheets ImportXML - Extract Class Information 【发布时间】:2020-04-23 22:33:54 【问题描述】:

关于 Stack Overflow 的第一篇文章!我的 IT/Dev 背景很少,我只是想学习如何使用 Google Sheets 中的 Import XML 功能进行数据抓取,以获得该功能的一些经验,但我遇到了减速带,希望您能提供帮助!

到目前为止,我已经成功地尝试提取我想要的数据,但是我还想提取少量信息,但到目前为止还不能真正弄清楚。我可以在 Google DevTools 中看到信息。 (附截图)

数据存储在类定义行中,它定义了 Last Seen 的时间,可通过以下两种方式之一访问。 网址:https://us.tamrieltradecentre.com/pc/Trade/SearchResult?ItemID=11807&SortBy=Price&Order=asc

ImportXML 的所需功能是提取文本或 URL 扩展 - 使用这两条信息之一的信息

感谢您的帮助!

*EDIT 添加了 Google 表格截图

Devtool Screenshot Google Sheets Screenshot

Red Circles for Values I Would Like To Import

【问题讨论】:

我必须为我糟糕的英语水平道歉。我无法从您的问题中了解您的目标。我能问一下您期望的结果值吗? 当然!我正在尝试从特定项目中收集和整合销售数据。摘要中的链接直接导航到搜索查询。我可以从该搜索查询中提取所有数据,但我无法从网站导入“上次看到”时间。如果您检查我添加的第二个屏幕截图,这是我目前用来尝试提取“上次看到”数据的公式,但是它填充了一个空单元格,没有错误或值。如您所见,其他列可以很好地提取实时数据。 所以期望的结果将是 -- =importxml("tamrieltradecentre.com/pc/Trade/…) -- 这将从主表中提取所有“上次看到”数字,就像它对另一个表一样类别。但是它不填充任何内容、错误或值。 感谢您回复并添加更多信息。我能理解你的目标。为此,当我检查 URL 的 html 时,发现像“1 小时前”这样的“上次看到”的值是使用 javascript 放置的。在这种情况下,不幸的是,IMPORTXML 无法检索这些值。对此我深表歉意。 嗨@Tanaike,感谢您在评论中的回答。您能否将其发布为答案可以覆盖更多人。通常,人们不阅读 cmets。 【参考方案1】: 您希望使用 IMPORTXML 从 URL 中检索“上次看到”的值,例如“1 小时前”。

当我检查 URL 的站点时,发现在您要使用的 URL 处,“1 小时前”之类的值是使用 Javascript 放置的。在这种情况下,不幸的是,无法使用IMPORTXML 检索。因为IMPORTXML 无法评估 Javascript。

【讨论】:

以上是关于Google 表格 ImportXML - 提取类信息的主要内容,如果未能解决你的问题,请参考以下文章

Google 表格——ImportXML 函数。接收错误?

Google 表格:=importxml 未加载某些结果

如何在 Google 表格中找出 IMPORTXML 的正确 xpath - 收到错误?

如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误?

使用 Importxml 函数时,在 Google 表格中包含单元格引用以形成 URL

自动刷新ImportXML Google表格