Como usar Wget en tus descargas

Publicado el 02 octubre 2014 por Juanbellas
Tal y como dice la Wikipedia Wget es es una herramienta libre que permite la descarga de contenidos desde servidores web de una forma simple. Su nombre deriva de World Wide Web (w), y de «obtener» (en inglés get), esto quiere decir: obtener desde la WWW.
Soporta los protocolos HHTP, HHTPS y FTP. Es una utilidad que no es interactiva, lo cual quiere decir que podría estar funcionando en segundo plano, aún cuando no hayamos iniciado sesión.
Suele verse mucho en los tutoriales explicando la previa descarga de tal o cual archivo antes de su instalación.
Vamos a ver aquí diversos ejemplos de uso de esta utilidad.
En caso de que quisiéramos descargar la imagen ISO de la beta de Ubuntu 14.10, habría que escribir en la Terminal:
$ wget http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
Nota: el símbolo $ es el que nos aparece por defecto al abrir la terminal, como usuarios normales.
Este comando nos descargaría la ISO de  Ubuntu 14.10 en su versión beta, y la guarda en el directorio en el que nos encontráramos al abrir la Terminal.
Si, por el motivo que fuese, se interrumpiera una descarga, y más tarde queremos reanudarla, lo podemos hacer añadiendo -c al comando wget:
$ wget -c http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
 Para realizar descargas en segundo plano, sería igual que en el caso anterior, pero usando -b:
$ wget -b http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
 Por defecto Wget utiliza todo el ancho de banda disponible para acelerar las descargas. Cuando necesitemos limitar ese ancho de banda, para que nos permita realizar otras tareas, podemos hacerlo añadiendo la opción –-limit-rate:
$ wget --limit-rate 100 Kbs http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
Esto hará que la velocidad de descarga se limite a 100k.
Si lo que queremos es descargar múltiples archivos, entonces primero tendríamos que crear un archivo de texto en el que introduciríamos todas las direcciones:
# cat download-list.txt
url1
url2
url3
Ahora ya podríamos descargar esos archivos a través del comando -i:
 $ wget -i download-list.txt
Por defecto, Wget realiza hasta 20 reintentos de descarga. Puede ocurrir que, si tenemos problemas de conexión, necesitemos aumentar ese número de reintentos de iniciar una descarga, tras una pérdida de conexión.
Lo haremos a través del comando --tries:
$ wget --tries=75 http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
Esto aumentará hasta 75 el número de reintentos.
Podemos redirigir, a un archivo que creemos en el momento de iniciar la descarga, el archivo de registro de la propia descarga con el comando -o:
$ wget -o Descarga http://releases.ubuntu.com/utopic/ubuntu-14.10-beta2-desktop-amd64.iso.torrent
En este caso el registro de esa descarga se grabaría en un archivo de texto que llamamos "Descarga", y que se creó en el propio directorio en el que nos encontramos.
Si nos interesa descargar un sitio web completo para su visualización en local en nuestro PC, y sin necesidad de conexión a Internet, podemos hacerlo así:
$ wget --mirror -p --convert-links -P ./<Carpeta-Local> url
Aquí vemos como:
  • --mirror: activa las opciones adecuadas para crear el espejo
  • -p: descarga todos los archivos que son necesarios para la visualización correcta del archivo Html.
  • --convert-links: después de la descarga, convierte los archivos para poder visualizarlos en local.
  • --P ./<Carpeta-Local>: guarda todos los archivos y directorios en el directorio especificado.
En esa misma descarga de un sitio web, puede ser que nos interese que no se descarguen las imágenes, por ejemplo. Lo haremos con el comando --reject:
$ wget --reject=png WEb-para-descargar
Podemos forzar a Wget a cancelar una descarga cuando el tamaño de esa descarga es superior a un tamaño dado usando la opción -Q:
$ wget -Q10m -i download.list.txt
De todas formas, esta limitación de cuota no afecta a cuando se descarga un solo archivo, que se descargará por completo. Ese límite sí se respetará cuando sea una descarga múltiple desde una archivo de texto, como en el ejemplo.
Si un archivo está protegido por contraseña podemos descargarlo de la siguiente manera:
$ wget --ftp-user=<nombre-usuario> --ftp-password=<contraseña> Descarga-Url
 Y bueno, estas y muchas otras opciones más, podemos verlas a través del manual de Wget al que podemos acceder desde la Terminal con:
$ man wget
Bueno, pues esto era todo.
Venga, nos leemos ;-)
Fuente: LinuxTechi