如何在 WP Web Scraper 中选择一些相同代码的代码?
Posted
技术标签:
【中文标题】如何在 WP Web Scraper 中选择一些相同代码的代码?【英文标题】:How to selector a code of some of the same code in WP Web Scraper? 【发布时间】:2016-09-11 17:38:24 【问题描述】:我使用WP Web Scraper 从以下链接中获取标题: http://lpse.acehtenggarakab.go.id/eproc/lelang/view/1316330
标题是:PENGAWASAN/SUPERVISI KEGIATAN FISIK TAHUN 2016
标题位于<td>
html 标记内,其属性为class="horizLine"
(它位于此html <table>
的第二行(<tr>
html 标记),包含 68 行)。
我的 WP Web Scraper 短代码是:
[wpws url="http://lpse.dephub.go.id/eproc/lelang/view/33737114" selector=".horizLine"]
但它不起作用。
我的问题:
如何在我的简码的 selector
属性中定位此标题,而其他人忽略?
【问题讨论】:
【参考方案1】:我认为您需要在短代码 selector
属性中添加更多元素,因为显示的 html 源代码是:
<tr>
<td class="TitleLeft">Kode Lelang</td>
<td colspan="3" class="horizLine"><b>1316330</b></td>
</tr>
<tr>
<td class="TitleLeft">Nama Lelang </td>
<td colspan="3" class="horizLine">
<b>
<strong>PENGAWASAN/SUPERVISI KEGIATAN FISIK TAHUN 2016</strong>
</b>
</td>
</tr>
<tr> …
这里是定位标题的解决方案是selector="tr:nth-child(2) td.horizLine b strong"
:
[wpws url="http://lpse.dephub.go.id/eproc/lelang/view/33737114" selector="tr:nth-child(2) td.horizLine b strong"]
对于:nth-child(2)
,我的目标是第二个<tr>
html 元素。
【讨论】:
以上是关于如何在 WP Web Scraper 中选择一些相同代码的代码?的主要内容,如果未能解决你的问题,请参考以下文章
Web Scraper 高级用法——抓取属性信息 | 简易数据分析 16