wget 递归下载整个网站(网站扒皮必备)

Posted 妖星杉木博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了wget 递归下载整个网站(网站扒皮必备)相关的知识,希望对你有一定的参考价值。

有时间看到别人网站的页面比较漂亮,就想给扒皮下来,学习学习。分享一个我常用网站扒皮命令wget
这个命令可以以递归的方式下载整站,并可以将下载的页面中的链接转换为本地链接。

wget加上参数之后,即可成为相当强大的下载工具。

wget命令详解:

wget -r -p -np -k http://xxx.com/xxx

-r, --recursive(递归) specify recursive download.(指定递归下载)
-k, --convert-links(转换链接) make links in downloaded html point to local files.(将下载的HTML页面中的链接转换为相对链接即本地链接)
-p, --page-requisites(页面必需元素) get all images, etc. needed to display HTML page.(下载所有的图片等页面显示所需的内容)
-np, --no-parent(不追溯至父级) don‘t ascend to the parent directory.

另外断点续传用-nc参数 日志 用-o参数

拿一个的网站扒皮试一下吧
执行 wget -r -p -np -k https://wujunze.com/ 命令
技术分享

等网站递归下载完毕,你会发现你当前目录会有一个 wujunze.com的目录
进入这个目录看一下
技术分享
熟练掌握wget命令,可以帮助你扒皮网站。










以上是关于wget 递归下载整个网站(网站扒皮必备)的主要内容,如果未能解决你的问题,请参考以下文章

wget 递归下载整个网站

wget 下载整个网站,或者特定目录

centos5.5get 递归下载整个网站

Centos下wget下载整个网站,或者目录全部文件

wget下载网站整个目录

wget递归下载网站资源