Revista Informática

Extraer textos en PDF desde PHP

Publicado el 06 mayo 2010 por Displaynone

Interesante librería que nos permite extraer textos de ficheros PDF, ignora todo aquello que no esté como texto en una capa y soporta ASCIIHexDecode, ASCII85Decode, FlateDecode:

include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('test.pdf');
$a->decodePDF();
echo $a->output();

 


Volver a la Portada de Logo Paperblog
Por  Ikaro Caroto
publicado el 27 agosto a las 20:48

LO probé y pues solo funciona con ciertos PDF; el mismo creador lo dice, ahora bien, una opción buena que encontré es XPDF, funciona con SHELL

Por  Hassan Hammad Lizalda
publicado el 07 noviembre a las 03:41

Esa clase no sirve. La he probado con 3 pdf´s y solo extrae de manera regular el texto de uno, para los otros no hace nada....

Por  Nara Guillen
publicado el 18 agosto a las 01:21

hola ya lo probe "PDF Text Extractor" pero sabes si extrae pero yo necesito estraer solo algunas letras y almacenarla en variable php para luego guardarlas en la bd podrias ayudarme x favor te lo agradeceria