如何使用 XPath 选择链接的内部文本？

Posted 2023-03-05

技术标签:

【中文标题】如何使用 XPath 选择链接的内部文本？【英文标题】：How to select inner text of the link using XPath? 【发布时间】：2016-09-30 05:04:10 【问题描述】：

我正在使用Scrapy 抓取数据。

在浏览器的JS 控制台上，我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]') 以获取我需要的内容，但我需要过滤数据。

下图为$x('//div[@class="summary"]//div[contains(@class, "tags")]')命令结果。

我应该如何编写xpath命令来获取绿色框中的数据？我试过$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]')，但这不是我想要的。

谢谢！

【问题讨论】：

你为什么跳过'python-2.7'？背后的逻辑是什么？（我认为这就是你所说的“不是我需要的”） @har07，我需要获取正确的 xpath 脚本来过滤 JS 控制台中的数据。见xpath @har07，对不起，我忘了在上面放一个盒子。谢谢！！！ 【参考方案1】：

要在选定的div 中选择<a> 元素的内部文本，您只需要将/a/text() 附加到选择div 的XPath 中：

//div[@class="summary"]//div[contains(@class, "tags")]/a/text()

【讨论】：

以上是关于如何使用 XPath 选择链接的内部文本？的主要内容，如果未能解决你的问题，请参考以下文章