如何用 php 抓取微信文章正文 / 蓝讯

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用 php 抓取微信文章正文 / 蓝讯相关的知识,希望对你有一定的参考价值。

参考技术A 可以用phpQuery试一下。
或者simple_html_dom
参考技术B 使用2个库: Guzzle & DomCrawler 参考技术C   很多人也有和你同样的想法,可以使用curl或file_get_contents。
  在这里以curl为例
  1、首先获得整个url对应的内容
  $ch=curl_init();
  curl_setopt($ch,CURLOPT_URL,$url);
  curl_setopt($ch,CURLOPT_HEADER,0);
  curl_setopt($ch,CURLOPT_TIMEOUT,5);
  curl_setopt($ch,CURLOPT_NOBODY,0);
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  curl_setopt($ch,CURLOPT_USERAGENT, 'Sogouspider');
  curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.47 Safari/536.11');
  $html=curl_exec($ch);
  curl_close($ch);
  2、从获$html里面提取正文内容
  $mark='<div class="rich_media_content " id="js_content">';
  $content=substr($html,strpos($html,$mark)+strlen($mark));
  $content=trim(substr($content,0,strpos($content,'<script type="text/javascript">')-50));
  很简单吧,且听风吟福利吧(3tii.com)就是这样抓取微信文章内容的。但是现在微信的图片外部是不能引用的了,所以你还要解决图片显示的问题。

以上是关于如何用 php 抓取微信文章正文 / 蓝讯的主要内容,如果未能解决你的问题,请参考以下文章

如何用php 编写网络爬虫?

微信公众平台消息接口里,如何用php获取用户头像

如何用python实现爬虫抓取网页时自动翻页

如何用PHP实现微信支付,求教。新手!说明详细点

如何用php开启企业微信开发的回调模式

PHP模拟浏览器访问,抓取非本地文件的几种方法爬虫