如何在 WP Web Scraper 中选择一些相同代码的代码?

Posted

技术标签:

【中文标题】如何在 WP Web Scraper 中选择一些相同代码的代码?【英文标题】:How to selector a code of some of the same code in WP Web Scraper? 【发布时间】:2016-09-11 17:38:24 【问题描述】:

我使用WP Web Scraper 从以下链接中获取标题: http://lpse.acehtenggarakab.go.id/eproc/lelang/view/1316330

标题是:PENGAWASAN/SUPERVISI KEGIATAN FISIK TAHUN 2016

标题位于<td> html 标记内,其属性为class="horizLine"(它位于此html <table> 的第二行(<tr> html 标记),包含 68 行)。

我的 WP Web Scraper 短代码是:

[wpws url="http://lpse.dephub.go.id/eproc/lelang/view/33737114" selector=".horizLine"]

但它不起作用。

我的问题: 如何在我的简码的 selector 属性中定位此标题,而其他人忽略?

【问题讨论】:

【参考方案1】:

我认为您需要在短代码 selector 属性中添加更多元素,因为显示的 html 源代码是:

<tr>
    <td  class="TitleLeft">Kode Lelang</td>
    <td colspan="3" class="horizLine"><b>1316330</b></td>
</tr>
<tr>
    <td class="TitleLeft">Nama Lelang </td>
    <td colspan="3" class="horizLine">
        <b>
            <strong>PENGAWASAN/SUPERVISI KEGIATAN FISIK TAHUN 2016</strong>
        </b>
    </td>
</tr>
<tr> …

这里是定位标题的解决方案是selector="tr:nth-child(2) td.horizLine b strong"

[wpws url="http://lpse.dephub.go.id/eproc/lelang/view/33737114" selector="tr:nth-child(2) td.horizLine b strong"]

对于:nth-child(2),我的目标是第二个&lt;tr&gt; html 元素。

【讨论】:

以上是关于如何在 WP Web Scraper 中选择一些相同代码的代码?的主要内容,如果未能解决你的问题,请参考以下文章

web scraper 抓取数据并做简单数据分析

web scraper 抓取网页数据的几个常见问题

Web Scraper 高级用法——抓取属性信息 | 简易数据分析 16

带有 dd 和 dt 条件的 web scraper chrome 扩展

Azure 中的 Python Web Scraper

简易数据分析 11 | Web Scraper 抓取表格数据