Hace unos días me vi en la tarea de imprimir sólo las imágenes de un documento de Word (.docx) de varias páginas con largos parrafos de texto entre cada una, situación que hacía imposible seleccionar todo el documento (Ctrl+A) y cortar las imágenes hacía otro archivo, y por el número de estas, seleccionar cada una de forma manual no era viable.
Afortunadamente (y gracias a la estandarización internacional del formato OOXML), es posible extraer todas las imágenes de un documento de Office mediante un sencillo truco que, además, funciona para extraer cualquier elemento individual del archivo de Office.
¿Quieres aprender a “diseccionar” estos archivos y extraer todas las imágenes de un documento de Office fácilmente? Te lo muestro a continuación.
Primero que nada, tienes que saber que los documentos OOXML de Microsoft Office, es decir, los .docx, .pptx, .xlsx y demás extensiones de los programas de Office, son en realidad archivos .zip con una extensión diferente (más detalles acerca de esto en el artículo de Introducción a OOXML (En inglés) de Microsoft), gracias a esto, es posible cambiar la extensión del archivo para poder extraer sus elementos como cualquier otro comprimido ZIP.
Para realizar el cambio de OOXML a ZIP no necesitarás de ninguna clase de conversor, si no que bastará con renombrar el documento de Office y cambiar su extensión (.docx, .pptx, .xlsx, etc) a .zip. Si Windows te muestra un aviso diciendo que el archivo puede quedar inútil, haz click en Aceptar y procede con el cambio de extensión.
Cambiar la extension del documento a .zip te permitirá extraer cada uno de sus elementos.Después de eso, podrás abrir el archivo .zip usando WinRar, 7-Zip o el propio explorador de Windows; el archivo contendrá varias carpetas con los estilos del documento y otra información necesaria para definir sus propiedades, pero en este caso la carpeta que nos interesa es la que tiene de nombre “word”, una vez abierto el directorio, deberemos ir a “media”.
En el directorio “word” encontrarás los elementos que contengadel archivo de Word. Dentro del directorio “media” se encuentrarán los archivos multimedia incrustados, entre ellos, las imágenes que se hayan agregado en Word.En el directorio media se almacenan todos los archivos multimedia que contenga el documento, como vídeos, audios y, por supuesto, las imágenes incrustadas que buscamos. Ahora podemos proceder a extraerlas o copiarlas hacía otro directorio y las obtendremos en su resolución y contenido original, si se les aplico un efecto o cambio de color a la imagen utilizando Word, este no se mostrará.
Cuando llegues al directorio conteniendo todas las imágenes, sólo tendrás que extraerlas o copiarlas a otro lugar.Y listo, después de esto contarás con todas las imágenes del documento listas para usarlas como desees sin tenerlas que haber obtenido individualmente de Word; si deseas seguir trabajando con el documento, sólo tendrás que cambiar su extensión de vuelta a la original.