Entrevista al #lideroculto, Héctor Canorea

Publicado el 11 diciembre 2015 por Alicia López González @Alijiri
Hoy en Lo que viene siendo una documentalista, entrevisto a un gran profesional que con motivo de las 3ras jornadas valencianas de documentación. A continuación, nos explica cómo ha sido trabajar en un proyecto interesantísimo de búsqueda y filtrado de información, en el que trabajo con Bárbara Pérez y Carlos Montagut. Pasad y leed.

1.   ¿Cómo surgió ser #líderocultoen las 3ras Jornadas de Documentación Valencianas?
Nos lo propusieron desde el COBDCV. Conocían el proyecto en que estábamos trabajando, y nos propusieron que nos presentáramos.
2.   ¿Cuál es el proyecto por el que fuiste elegido? Explícalo
El proyecto constaba de partes: un “canvas” donde poder trabajar con información y datos para preparar trabajos y presentaciones; y un buscador especializado en información de mercado. Era un único producto, puesto que iban a estar integradas las dos partes, pero eran dos trabajos y esfuerzos totalmente diferentes.
Nosotros trabajábamos en la parte del buscador. En un primer momento (fue la mayor parte del tiempo) teníamos que nutrir al buscador de fuentes de información que consideráramos interesantes para conseguir información de mercado. Teníamos fuentes de información institucionales, asociaciones, publicaciones periódicas... Llegamos a recopilar alrededor de 50000 fuentes de información. Un ejemplo de fuente de información que considerábamos era http://www.ceoe.es/
Posteriormente, pasamos a trabajar más estrechamente con los desarrolladores. Aquí había dos frentes abiertos: por un lado poder conseguir todas las páginas interesantes que tenía cada fuente de información (siguiendo con el ejemplo anterior de la CEOE, teníamos que obtener todas las páginas que pudieran contener información relevante para nuestro fin, por ejemplo, estas páginas: http://www.ceoe.es/publicaciones_periodicas-situacion_socioeconomica-cat308.html) y por el otro que la recuperación de la información fuera relevante y precisa.
En la parte de obtener la mayor cantidad de páginas, los documentalistas realizábamos comprobaciones de que el crawler (Robot que se encarga de extraer las páginas internas de una web), que se encargaba de obtener estas páginas lo hiciera correctamente (o al menos fuera consistente), ya fuera mediante análisis manual o mediante comparativas entre diferentes herramientas de extracción de urls.
En la parte de la recuperación de información, los documentalistas teníamos como misión conseguir que las páginas que habíamos obtenido mediante el crawler, fueran etiquetadas correctamente. Construímos vocabularios de diferentes ámbitos: de diferentes sectores económicos (no es lo mismo un documento que habla de arroz que otro que habla de coches), de diferentes localizaciones geográficas (un documento puede hablar de China y otro de España, hablar del mismo tema, y no interesar por igual a todos los usuarios), de diferentes tipos de necesidades de información (no es lo mismo hablar de exportaciones e importaciones que de legislación)...
En un último paso, evaluábamos que los resultados obtenidos en el buscador fueran relevantes y precisos, como un Google rater.
Ese era nuestro trabajo como documentalistas, conseguir junto a los desarrolladores un Google  especializado en información de mercado. Tuvimos errores y aciertos, y lamentablemente no pudimos salir al mercado, pero la experiencia de vivir un proyecto tan interesante no nos la va a quitar nadie.
3.   ¿Cómo ves la situación actual de bibliotecarios, documentalistas y profesionales de la información?
Pues actualmente veo un momento de cambio constante. Hemos pasado de ser archiveros, bibliotecarios y documentalistas a ampliar nuestro campo metiendo la cabeza en el mundo “Community Manager”, marketing on-line, gestión de contenidos, SEO-SEM... Pero aún nos queda un paso más que dar: el BIG DATA. Hay tenemos un filón por explotar. Se supone que somos profesionales de la información, pues démosles lo que necesitan, consigamos que ese big data pase a ser información, o al menos sea lo más parecido a ella.
Creo que tenemos que dar un pequeño giro a nuestra formación clásica y movernos hacia el mundo digital, pero no sólo a pequeña escala de redes sociales, páginas web... Sino al mundo de la ingente cantidad de datos que pueden manejar las empresas (todas, grandes y pequeñas) en estos momentos.
4.   ¿Crees que es necesario adaptar la profesión a las nuevas formas de la difusión de la información como redes sociales, big data, etc?
Por supuesto, como decía antes, creo que el futuro de la profesión está más ligado al big data, redes sociales, machine learning, que al clásico bibliotecario sentado en su ordenador sacando estadísticas de uso de la colección (que por cierto, también es apasionante), o al archivero manchado de polvo.
5.   ¿Cómo podemos hacernos más visibles en esta sociedad extra informada?
Creo que para hacernos más visibles tenemos que movernos más, salir de nuestra zona de confort. Está muy bien contar nuestras experiencias de trabajo a compañeros de profesión, pero ellos ya saben lo que podemos aportar. Lo importante es contar nuestras experiencias a aquellos que no conocen nuestra profesión.
Te cuento una anécdota que me pasó en unas conferencias sobre Machine Learning. Después de una de las charlas, me dirigí al orador para conocer acerca de su trabajo. Él se encargaba mediante una herramienta de Machine Learning de hacer predicciones sobre la cantidad de reservas que iba a tener un hotel y el origen de esas reservas, edades... Para hacer esas predicciones, necesitaba tener una gran muestra de datos, que él mismo se había encargado de normalizar y revisar que estuviera correctamente organizada, este trabajo le había llevado el 80% del tiempo que había dedicado a hacer la predicción, al cual sólo le había dedicado el 20%. Es decir, al trabajo principal le había dedicado el 20% y al adherido el 80%. Ese 80% del tiempo es básicamente un trabajo fácilmente realizable por un documentalista (el otro 20% también, pero necesitas un poco más de formación complementaria), y cuando se lo comenté me dijo que no lo había pensado, pero que nadie se lo había dicho nunca tampoco.
Creo que ese es nuestro problema. No salimos hacia mundos desconocidos, y por eso nunca dejan de ser desconocidos. Y lo que es peor, nosotros tampoco dejamos de ser invisibles y desconocidos.
6.   ¿Cuál será tu trabajo dentro de 20 años?
No me aventuro a hacer esta predicción, puesto que hace dos años no se me hubiera ocurrido que pudiera trabajar en la creación de un buscador tipo google, y hace un año no se me pasaba por la cabeza estar en un archivo. Y puedo decir que he trabajado en la creación de un buscador tipo google y ahora estoy en un archivo municipal.
Lo que sí puedo decir es que mi trabajo estará relacionado con la información y con facilitar su acceso a ella a todos aquellos que la necesiten.
Muchas gracias Alicia por darme la oportunidad de salir en esta ventana que es tu blog. Podéis saber más de mi, en mi perfil de linkedin https://es.linkedin.com/in/hectorcanorea o en mi cuenta de Twitter 
Héctor Canorea Martínez