Revista Informática

Microsoft anuncia una IA que permite crear voces realistas con poco entrenamiento

Publicado el 27 mayo 2019 por Daniel Rodríguez @analyticslane

Actualmente está creciendo la popularidad de las interfaces habladas debido a la popularidad entre otros de los asistentes de voz. Aunque existe un problema importante: obtener una salida de voz que suene natural es aún muy complicado. Siendo necesario un entrenamiento muy costoso. Microsoft acaba de anunciar que ha desarrollado una forma más eficaz. Creando una inteligencia artificial que puede traducir texto a voz a con solamente 200 muestras de sonido, lo que es alrededor de 20 minutos. Para lo que se utilizan modelos basados en redes neuronales profundas.

Los sonidos obtenidos aún muestras un ligero sonido robótico, pero son muy precisos con una inteligibilidad de las palabras. Provocando que las soluciones de texto a voz sean más accesibles y populares en un futuro próximo. Ofreciendo así a pequeñas empresas y aficionados la probabilidad de crear voces artificiales realistas.
eñas empresas y aficionados la probabilidad de crear voces artificiales realistas.

Imágenes: Pixabay (Michael Gaida)

No te olvides valorar esta entrada

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones de Analytics Lane.

Contenido relacionado


Volver a la Portada de Logo Paperblog