matlab学习 — 实现简单的爬虫

Posted darkchii

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了matlab学习 — 实现简单的爬虫相关的知识,希望对你有一定的参考价值。

  这里复杂的情况暂时不考虑。。测试网址为pixiv的每日排行榜 = =

url = ‘https://www.pixiv.net/ranking.php?mode=daily‘
text = webread(url) % urlopen函数也可以打开网页
link = regexp(text,‘data-filter=".*?lazy-image"data-src="(https.+?.(jpg|png))"‘,‘tokens‘) % 区分大小写的正则表达式函数 tokens匹配所有圆括号中的标文 regexpi函数不区分大小写

for i = 1 : length(link)
rgb = webread(char(link{i})) % webread函数可读取图片、音频等数据并返回对应的解析数据
imshow(rgb) % 显示图片
type = char(link{i})
name = [num2str(i) type(end-4:end)]
imwrite(rgb,[‘C:\\Users\\adimin\\Desktop\\video\\‘ name]) % 下载
end

  

  运行结果:

技术分享图片

  emm。。。实际上,才跑了一张图就停了233,不知道是不是太快了 还是什么,停掉的原因是被请求被禁止了:403
  不过有效果就算成功了。

以上是关于matlab学习 — 实现简单的爬虫的主要内容,如果未能解决你的问题,请参考以下文章

基于场景分析法的电动车优化调度(Matlab代码实现)

基于粒子群算法的电力系统无功优化研究(IEEE14节点)(Matlab代码实现)

IOS开发-OC学习-常用功能代码片段整理

浅谈网络爬虫中深度优先算法和简单代码实现

scrapy按顺序启动多个爬虫代码片段(python3)

scrapy主动退出爬虫的代码片段(python3)