Revista Informática

Monolith: El sueño de un acaparador de datos hecho realidad

Publicado el 10 enero 2023 por Ferlanero @ferlanero
Monolith: El sueño de un acaparador de datos hecho realidad
El sueño de cualquier acaparador de datos hecho realidad: agrupar cualquier página web en un solo archivo HTML.

Ya puedes reemplazar ese millón de pestañas abiertas con un millón de archivos .html almacenados en algún lugar de su pequeño y precioso disco.
A diferencia de la función "Guardar página como" convencional, monolith no solo guarda el documento de destino, sino que incorpora activos de CSS, imágenes y JavaScript a la vez, produciendo un solo documento HTML5 que es un placer almacenar y compartir.
Si se compara con guardar sitios web con wget -mpk, esta herramienta incorpora todos los activos como URL de datos y, por lo tanto, permite que los navegadores reproduzcan la página guardada exactamente como estaba en Internet, incluso cuando no hay conexión de red disponible.

monolith 2.6.1
Sunshine <[email protected]>
Mahdi Robatipoor <[email protected]>
Emmanuel Delaborde <[email protected]>
Emi Simpson <[email protected]>
rhysd <[email protected]>

 _____   ______________   __________   ___________________   ___
|   \   /   \  |   |   |   |  |   |
|   \_/   __   \_|   __   |   |   ___   ___   |__|   |
|   |  |   |  |   |   |   |   |   |   |   |
|   |\   /|   |__|   _   |__|   |____|   |   |   |   |   __   |
|   | \___/ |   | \   |   |   |   |   |  |   |
|___|   |__________|  \_____________________|   |___|   |___|  |___|

CLI tool for saving web pages as a single HTML file
USAGE:
   monolith [FLAGS] [OPTIONS] <target>
FLAGS:
   -h, --help   Prints help information
   -e, --ignore-errors   Ignore network errors
   -k, --insecure   Allows invalid X.509 (TLS) certificates
   -I, --isolate   Cuts off document from the Internet
   -a, --no-audio   Removes audio sources
   -c, --no-css   Removes CSS
   -F, --no-fonts   Removes fonts
   -f, --no-frames   Removes frames and iframes
   -i, --no-images   Removes images
   -j, --no-js   Removes JavaScript
   -M, --no-metadata   Excludes timestamp and source information
   -v, --no-video   Removes video sources
   -s, --silent   Suppresses verbosity
   -n, --unwrap-noscript   Replaces NOSCRIPT elements with their contents
   -V, --version   Prints version information
OPTIONS:
   -b, --base-url <http://localhost/>   Sets custom base URL
   -C, --charset <UTF-8>   Enforces custom encoding
   -o, --output <document.html>   Writes output to <file>, use - for STDOUT
   -t, --timeout <60>   Adjusts network request timeout
   -u, --user-agent <Firefox>   Sets custom User-Agent string
ARGS:
   <target>   URL or file path, use - for STDIN


Volver a la Portada de Logo Paperblog