php正则抓取网站

Posted slothful

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了php正则抓取网站相关的知识,希望对你有一定的参考价值。

通过crul抓取到网站之后,通过 preg_match(单一数据) preg_match_all(重复数据,如ul内的li内容或者多个格式一样的控件)来截取自己想要的部分


正则归纳

表示包含所有元素  .*?

空格 s

图片 "/(href|src)=(["|‘]?)([^"‘>]+.(jpg|JPG|jpeg|JPEG|gif|GIF|png|PNG))/i"

a标签 ‘/<a href="(.*?)".*?>(.*?)</a>/i‘

preg_match(‘/<divsclass="content_list">.*?</div>/s‘,$html,$divList);

 

以上是关于php正则抓取网站的主要内容,如果未能解决你的问题,请参考以下文章

php如何使用正则表达式匹配url图片啊

PHP正则抓取字符串内某段字符

PHP正则提取字符串

php抓取一个页面的图片

php 正则表达式 匹配网站内容

php 正则表达式匹配(持续更新)