08月11, 2017

如何下载一个Apache下的网站的目录

现有一需求,下载一个Apache展示的目录http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/

考虑使用wget。

执行wget -e robots=off -r -t 0 -l 0 -c -np -o wget.log http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/即可。

但完成之后会产生一些网页文件,这是由于wget会下载网页上所有的链接导致的,因此我们要手动进行删除操作,find . -name 'index.html*' -delete等等。

PS: 如果你是下载一个网页的话,最好加上-p-k参数,即下载网页上的图片以及将绝对链接转成相对链接。

本文链接:https://debug.fanzheng.org/post/how-to-download-a-http-directory-which-is-listed-by-apache.html

-- EOF --

Comments

评论加载中...

注:如果长时间无法加载,请针对 disq.us | disquscdn.com | disqus.com 启用代理。