PHP file_get_contents() 的行为与浏览器不同
Posted
技术标签:
【中文标题】PHP file_get_contents() 的行为与浏览器不同【英文标题】:PHP file_get_contents() behaves differently to browser 【发布时间】:2011-02-02 15:45:08 【问题描述】:我正在尝试使用 php 下载网页的内容。 当我发出命令时:
$f = file_get_contents("http://mobile.mybustracker.co.uk/mobile.php?searchMode=2");
它返回一个页面,报告服务器已关闭。然而,当我将相同的 URL 粘贴到浏览器中时,我得到了预期的页面。
有人知道是什么原因造成的吗? file_get_contents 是否传输任何将其与浏览器请求区分开来的标头?
【问题讨论】:
【参考方案1】:是的,有区别——浏览器倾向于发送大量附加的HTTP headers,我会说;并且两者发送的可能没有相同的值。
这里,做了几次测试后,似乎有必要传递名为Accept
的HTTP标头。
这可以使用file_get_contents
的第三个参数来指定附加上下文信息:
$opts = array('http' =>
array(
'method' => 'GET',
//'user_agent ' => "Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6",
'header' => array(
'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*\/*;q=0.8
'
),
)
);
$context = stream_context_create($opts);
$f = file_get_contents("http://mobile.mybustracker.co.uk/mobile.php?searchMode=2", false, $context);
echo $f;
有了这个,我就可以得到页面的HTML代码了。
备注:
我第一次测试通过User-Agent
,但似乎没有必要--这就是为什么相应的行在这里作为注释
用于Accept
标头的值是我在尝试使用file_get_contents
之前使用Firefox 请求该页面时使用的一个Firefox。
其他一些值可能没问题,但我没有做任何测试来确定哪个值是必需的。
欲了解更多信息,您可以查看:
file_get_contents
stream_context_create
Context options and parameters
HTTP context options --这是有趣的页面,在这里 ;-)
【讨论】:
【参考方案2】:用 %20 替换所有空格
【讨论】:
以上是关于PHP file_get_contents() 的行为与浏览器不同的主要内容,如果未能解决你的问题,请参考以下文章
file_get_contents 通过 php 失败,通过浏览器工作
PHP 将变量发送到 file_get_contents()
C# 相当于 file_get_contents (PHP)