现有一需求,下载一个Apache展示的目录http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/。
考虑使用wget。
执行wget -e robots=off -r -t 0 -l 0 -c -np -o wget.log http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/
即可。
但完成之后会产生一些网页文件,这是由于wget会下载网页上所有的链接导致的,因此我们要手动进行删除操作,find . -name 'index.html*' -delete
等等。
PS: 如果你是下载一个网页的话,最好加上-p
和-k
参数,即下载网页上的图片以及将绝对链接转成相对链接。
Comments
注:如果长时间无法加载,请针对 disq.us | disquscdn.com | disqus.com 启用代理。