Revista Comunicación

Subtitular vídeos con la ayuda de tecnología de reconocimiento de voz

Publicado el 26 junio 2018 por Mglobal

Hoy en día subtitular los vídeos en línea es una práctica en ascenso, no en vano YouTube ofrece la opción de subtitulación automática aún cuando no es 100% perfecta, y es justo en este punto donde queremos hacer foco:

¿Cómo funciona la tecnología que nos permite obtener los subtítulos?

¿Qué otras herramientas hay para subtitular vídeos y en otros idiomas?

¿Por qué hay que subtitular los vídeos?

Antes de entrar en materia, vamos a ponernos rápidamente en contexto. Ello es más que necesario para entender las tendencias del mercado y así mantenernos en la cresta de la ola.

En pocas palabras, el futuro de las marcas es el vídeo marketing. Y, si bien el uso del vídeo en los planes de marketing no es nada nuevo, sí que lo es el rol que ahora este ostenta. Su difusión puede y tiene que hacerse en todas las plataformas, en especial en las redes sociales: Facebook, Instagram, Twitter, Snapchat….

Y si a lo anterior le sumamos la tendencia de ver los videos sin sonido (el 85% de los usuarios de Facebook suelen ver videos en mudo), es más que evidente por qué muchas empresas y medios están invirtiendo en subtitular vídeos. Pero no entremos más en detalle sobre esto por ahora.

Volvamos a nuestro foco: para obtener los subtítulos podemos recurrir a la tecnología de reconocimiento de voz. Se trata de una herramienta que automatiza y agiliza el trabajo manual de transcripción para luego llevarlo a subtítulos; en otras palabras: convierte el audio/vídeo en texto, aunque con algunas limitaciones. ¿Cómo funciona?

La tecnología de reconocimiento de voz

Podemos definirla como un conjunto de métodos informáticos que permiten convertir un archivo de audio o vídeo en texto, siendo el dictado de voz, comercializado desde los años 80, la aplicación más popular de este tipo de tecnología.

Afortunadamente, los recientes progresos tecnológicos nos ofrecen hoy la oportunidad de explotar esta herramienta y aplicarla de otras formas, a saber:

  • El subtitulado y la traducción automática del vídeo
  • La indexación y extracción de información de documentos audiovisuales.
  • Las interfaces de voz hombre-máquina como Siri.

De concentramos en los puntos 1 y 2, los límites de la tecnología de reconocimiento de voz son, por ejemplo, su imprecisión para reconocer palabras o formas de hablar (jergas acentos…), transcribir lo dicho por más de un hablante y marcar todos los signos de puntuación. Asimismo, se ve afectada por factores ambientales, es decir, si el sonido ambiente es muy fuerte, el reconocimiento de voz será débil.

Lo bueno es que estas fallas se van corrigiendo constantemente. Las empresas que ofrecen este tipo servicio tienen como prioridad el desarrollo de sus plataformas para que sean cada vez más inteligentes. Siri ya nos entiende más

😉

Si hablamos de las plataformas que ofrecen la obtención de subtítulos, hay algunas que sólo ofrecen el subtitulado automático como YouTube y otras que ofrecen el subtitulado automático más la revisión manual, es el caso de la plataforma online Authôt.

Herramientas gratuitas y de pago para obtener subtítulos

Tenemos opciones como YouTube, que no está nada mal pues nos permite obtener los subtítulos automáticos o subir los propios. Por tanto, lo tienes fácil si no te molestan ciertos errores de transcripción y si los vídeos solo serán publicados en este medio.

Otras herramientas son las del dictado, como GoogleDoc, Dictation o Speechnotes  que como su nombre lo indica no están diseñadas precisamente para obtener los subtítulos con su timecode, pero por ser gratis muchas personas las usan.

Con un poco de inventiva, muchos usuarios activan el micrófono de estas plataformas e inmediatamente ponen a rodar el vídeo para que este “dicte” lo que se debe transcribir. ¿Funciona? Si el audio es bueno el resultado también lo será.  

El detalle de estas herramientas de dictado es que su proceso es lento. La transcripción se hace en el mismo tiempo del vídeo, es decir, si dura una hora, tendrás que esperar una hora para que la plataforma lo transcriba. Además, no podrás exportar dicho texto en formato .srt, lo que implica  tener que completar manualmente la sincronización de los subtítulos.

Por otro lado, hay herramientas de pago para obtener los subtítulos automáticos y entre ellas algunas que incluyen servicios de revisión, incrustación e incluso  traducción. Un ejemplo sería la plataforma online Authôt. Cuenta con una versión gratuita donde se pueden subir 10 min de vídeo o audio.

Lo interesante de esta plataforma es la rapidez de su tecnología de reconocimiento de voz. Se transforma el audio/vídeo en texto en pocos minutos, con un resultado de 97% de efectividad si el audio es de calidad; por ejemplo, un vídeo de 1 hora se transforma en texto en 12 min

Además, están sus múltiples formatos de exportación, evidentemente, el subtitulado con su timecode (.srt) y otros (txt, .mp3, .mp4, y más). El servicio de corrección manual y el de traducción también están disponibles.

tecnología de reconocimiento de voz

¿Por qué hay que subtitular los vídeos?

Podemos mencionar tres razones al menos.

  1. El hábito de ver los vídeos sin sonido en las redes sociales.
  2. El alto engagement de los vídeos subtitulados, llega a un público más amplio (accesibilidad).
  3. Su utilidad para internacionalizar los contenidos si éstos se traducen.

En una investigación realizada por la empresa Animoto en 2017, se constató el gran valor que tiene el vídeo en Internet, especialmente en Facebook, medio donde el 85% de los vídeos son reproducidos sin sonido, sumando a que el 39% de los usuarios ve el vídeo hasta el final si tiene subtítulos. Vale destacar, también,la preferencia por ver vídeos pre-grabados (52%).Por otra parte, las empresas que usan vídeos subtitulados están favoreciendo la accesibilidad digital. Los contenidos se hacen más accesibles para las personas sordas o con dificultades auditivas, cumpliedo así con el Real Decreto Legislativo del 29 de noviembre de 2013, sobre los derechos de las personas con discapacidad y de su inclusión social.

Asimismo, si los videos cuentan con subtítulos en otros idiomas, sin duda alguna su alcance será mayor. Esta práctica de traducción es aplicada por las grandes medios como el grupo de prensa estadounidense Condé Nast, que lleva revistas como Vogue, GQ y Vanity Fair.  

Finalmente, se puede ir más lejos si los subtítulos se exportan como texto para ser reusados en la nube.  Así dicho contenido puede convertirse en un artículo para el blog de la empresa y, por qué no, como un e-book. Es una excelente práctica reusar los subtítulos y mejor aún si con ello se beneficia el posicionamiento SEO de tu sitio web.

Artículo cortesía de Greily Moreno: periodista y community manager, actualmente es miembro del equipo de marketing de Authôt, empresa francesa dedicada a la transcripción automática y manual así como al subtitulado.


Volver a la Portada de Logo Paperblog