Revista Informática

Convertir un archivo PDF en archivo de texto desde una terminal

Publicado el 07 abril 2019 por Oscar Oscar Meza @vidagnu

Convertir un archivo PDF en archivo de texto desde una terminal

Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama "pdftotext" y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

El paquete "poppler-utils" contiene entre otras herramientas a "pdftotext", ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

El comando "pdftotext" tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro "-layout" como se muestra en el ejemplo siguiente.

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro "-opw" como se muestra en el ejemplo siguiente.

Para mas información lee su manual de uso con el comando "man pdftotext".


Volver a la Portada de Logo Paperblog