Google 表格 ImportXML - 提取类信息
Posted
技术标签:
【中文标题】Google 表格 ImportXML - 提取类信息【英文标题】:Google Sheets ImportXML - Extract Class Information 【发布时间】:2020-04-23 22:33:54 【问题描述】:关于 Stack Overflow 的第一篇文章!我的 IT/Dev 背景很少,我只是想学习如何使用 Google Sheets 中的 Import XML 功能进行数据抓取,以获得该功能的一些经验,但我遇到了减速带,希望您能提供帮助!
到目前为止,我已经成功地尝试提取我想要的数据,但是我还想提取少量信息,但到目前为止还不能真正弄清楚。我可以在 Google DevTools 中看到信息。 (附截图)
数据存储在类定义行中,它定义了 Last Seen 的时间,可通过以下两种方式之一访问。 网址:https://us.tamrieltradecentre.com/pc/Trade/SearchResult?ItemID=11807&SortBy=Price&Order=asc
ImportXML 的所需功能是提取文本或 URL 扩展 - 使用这两条信息之一的信息
感谢您的帮助!
*EDIT 添加了 Google 表格截图
Devtool Screenshot Google Sheets Screenshot
Red Circles for Values I Would Like To Import
【问题讨论】:
我必须为我糟糕的英语水平道歉。我无法从您的问题中了解您的目标。我能问一下您期望的结果值吗? 当然!我正在尝试从特定项目中收集和整合销售数据。摘要中的链接直接导航到搜索查询。我可以从该搜索查询中提取所有数据,但我无法从网站导入“上次看到”时间。如果您检查我添加的第二个屏幕截图,这是我目前用来尝试提取“上次看到”数据的公式,但是它填充了一个空单元格,没有错误或值。如您所见,其他列可以很好地提取实时数据。 所以期望的结果将是 -- =importxml("tamrieltradecentre.com/pc/Trade/…) -- 这将从主表中提取所有“上次看到”数字,就像它对另一个表一样类别。但是它不填充任何内容、错误或值。 感谢您回复并添加更多信息。我能理解你的目标。为此,当我检查 URL 的 html 时,发现像“1 小时前”这样的“上次看到”的值是使用 javascript 放置的。在这种情况下,不幸的是,IMPORTXML
无法检索这些值。对此我深表歉意。
嗨@Tanaike,感谢您在评论中的回答。您能否将其发布为答案可以覆盖更多人。通常,人们不阅读 cmets。
【参考方案1】:
您希望使用 IMPORTXML
从 URL 中检索“上次看到”的值,例如“1 小时前”。
当我检查 URL 的站点时,发现在您要使用的 URL 处,“1 小时前”之类的值是使用 Javascript 放置的。在这种情况下,不幸的是,无法使用IMPORTXML
检索。因为IMPORTXML
无法评估 Javascript。
【讨论】:
以上是关于Google 表格 ImportXML - 提取类信息的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Google 表格中找出 IMPORTXML 的正确 xpath - 收到错误?
如何在 Google 表格中为 IMPORTXML 找出正确的 xpath - N/A 错误?