如何用 php 抓取微信文章正文 / 蓝讯
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用 php 抓取微信文章正文 / 蓝讯相关的知识,希望对你有一定的参考价值。
参考技术A 可以用phpQuery试一下。或者simple_html_dom 参考技术B 使用2个库: Guzzle & DomCrawler 参考技术C 很多人也有和你同样的想法,可以使用curl或file_get_contents。
在这里以curl为例
1、首先获得整个url对应的内容
$ch=curl_init();
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_HEADER,0);
curl_setopt($ch,CURLOPT_TIMEOUT,5);
curl_setopt($ch,CURLOPT_NOBODY,0);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_USERAGENT, 'Sogouspider');
curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.47 Safari/536.11');
$html=curl_exec($ch);
curl_close($ch);
2、从获$html里面提取正文内容
$mark='<div class="rich_media_content " id="js_content">';
$content=substr($html,strpos($html,$mark)+strlen($mark));
$content=trim(substr($content,0,strpos($content,'<script type="text/javascript">')-50));
很简单吧,且听风吟福利吧(3tii.com)就是这样抓取微信文章内容的。但是现在微信的图片外部是不能引用的了,所以你还要解决图片显示的问题。
以上是关于如何用 php 抓取微信文章正文 / 蓝讯的主要内容,如果未能解决你的问题,请参考以下文章