Revista Informática

Convertir un archivo PDF en archivo de texto desde una terminal

Publicado el 12 septiembre 2015 por Oscar Oscar Meza @vidagnu
Convertir un archivo PDF en archivo de texto desde una terminal

Hay muchas herramientas en Linux para convertir una archivo PDF a texto plano desde la linea de comandos, la herramienta que voy a mencionar aquí se llama "pdftotext" y viene instalada por defecto en la mayoría de distribuciones, si en tu caso no la tienes instalada prueba instalarla con el siguiente comando.

~ $ sudo apt-get install poppler-utils

El paquete "poppler-utils" contiene entre otras herramientas a "pdftotext", ahora que ya lo tienes instalado para convertir un archivo utilizamos el siguiente comando.

~ $ pdftotext archivopdf.pdf archivotxt.txt

El comando "pdftotext" tiene muchas opciones, por ejemplo puedes convertir un archivo pdf a texto conservando el diseño (encabezado, pie de pagina, etc.) usando el parámetro "-layout" como se muestra en el ejemplo siguiente.

~ $ pdftotext -layout archivopdf.pdf archivotxt.txt

También puedes convertir un archivo pdf protegido con password a texto usando el parámetro "-opw" como se muestra en el ejemplo siguiente.

~ $ pdftotext -opw "password" archivopdf.pdf archivotxt.txt

Para mas información lee su manual de uso con el comando "man pdftotext".

Acerca del Autor

Mas informacion sobre el autor de este Blog


Volver a la Portada de Logo Paperblog