dissabte, 18 d’abril del 2015

Descargar una página web completa con wget

Para bajar una página:
$ wget http://blog.desdelinux.net/con-el-terminal-bajar-un-sitio-web-completo-con-wget
Para bajar el sitio completo de forma recursiva, incluyendo imágenes y otros tipos de datos:
$ wget -r http://blog.desdelinux.net/
Y aquí viene la magia. Como bien nos explican en el artículo de HumanOS, muchos sitios verifican la identidad del navegador para aplicar diversas restricciones. Con Wget podemos burlar esto de la siguiente forma:
wget  -r -p -U Mozilla http://blog.desdelinux.net/
O también podemos hacer pausa entre cada página, ya que de lo contrario el dueño del sitio puede darse cuenta que e estamos bajando el sitio completamente con Wget.
wget --wait=20 --limit-rate=20K -r -p -U Mozilla http://blog.desdelinux.net/

Cap comentari :

Publica un comentari a l'entrada