从网站表中提取数据

Posted

技术标签:

【中文标题】从网站表中提取数据【英文标题】:Extracting data from a website table 【发布时间】:2015-08-26 02:09:03 【问题描述】:

Goal.com 网站上有一张表格,我附上了这个问题。我想知道如何将列 Player Name 中的字符串以某种方式存储到变量或数据库中。

这是因为我的代码中有一个名为$player 的变量。这个变量每 24 小时存储一个不同的字符串,并打印到我的网站上。这是通过使用定制功能来完成的。

我想对 if '$player' is equal to any string in the column 'Player Name' from goal.com 进行编码,以重新运行该函数,以便将不同的字符串存储在变量中并打印在我的网站上。

表格:http://www.goal.com/en/scores/transfer-zone?ICID=TZ_DD1_VA

【问题讨论】:

SELECT player_name FROM myTable?? 您可能想研究如何使用 php 解析 html。这是example Q&A。更具体地说,这是另一个Q&A discussing parsing an HTML table。 谢谢,我去看看 【参考方案1】:

PHP Simple HTML DOM Parser 可以为您完成这项工作。 http://simplehtmldom.sourceforge.net/

在此处下载 simple_html_dom.php; http://sourceforge.net/projects/simplehtmldom/files/simple_html_dom.php/download

这是一个完整的例子。

<?php
include("simple_html_dom.php");

libxml_use_internal_errors(true);

$doc = new DOMDocument();
$doc->loadHTMLFile("http://www.goal.com/en/scores/transfer-zone?ICID=TZ_DD1_VA");
$xpath = new DOMXPath($doc);

$player_names = $xpath->query("//td[@class='player_name_col']");

foreach ($player_names as $player_name) 

    echo $player_name->nodeValue . "<br />";



?>

【讨论】:

刚刚尝试了代码,但它不起作用?,只是对每个结果都说不。 这个例子对我来说很好,你为简单的 html dom include() 设置了正确的文件名吗?

以上是关于从网站表中提取数据的主要内容,如果未能解决你的问题,请参考以下文章

从外部页面中提取元素的内容

使用 XSLT 从网站中提取数据

如何从网站上从 ESRI Arcgis 抓取/提取数据?

使用 Beautifulsoup 从网站中提取数据

使用 Selenium 返回空 DataFrame 从网站抓取表格

通过 PHP 从网站中提取数据