如何使用 XPath 选择链接的内部文本?
Posted
技术标签:
【中文标题】如何使用 XPath 选择链接的内部文本?【英文标题】:How to select inner text of the link using XPath? 【发布时间】:2016-09-30 05:04:10 【问题描述】:我正在使用Scrapy
抓取数据。
在浏览器的JS
控制台上,我输入$x('//div[@class="summary"]//div[contains(@class, "tags")]')
以获取我需要的内容,但我需要过滤数据。
下图为$x('//div[@class="summary"]//div[contains(@class, "tags")]')
命令结果。
我应该如何编写xpath
命令来获取绿色框中的数据?我试过$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]')
,但这不是我想要的。
谢谢!
【问题讨论】:
你为什么跳过'python-2.7'?背后的逻辑是什么? (我认为这就是你所说的“不是我需要的”) @har07,我需要获取正确的 xpath 脚本来过滤 JS 控制台中的数据。见xpath @har07,对不起,我忘了在上面放一个盒子。谢谢!!! 【参考方案1】:要在选定的div
中选择<a>
元素的内部文本,您只需要将/a/text()
附加到选择div
的XPath 中:
//div[@class="summary"]//div[contains(@class, "tags")]/a/text()
【讨论】:
以上是关于如何使用 XPath 选择链接的内部文本?的主要内容,如果未能解决你的问题,请参考以下文章
(CSS / jQuery/ XPath) 用于从姐妹/兄弟节点 (DOM) 获取内部文本的选择器