
Video Breakdown es uno de tantos proyectos de Microsoft Garage, una plataforma que permitirá buscar videos y encontrarlos mediante tecnologías de reconocimiento como detección de rostro y OCR, contenido seguro gracias al cifrado AES. Por el momento sólo está disponible mediante invitación y esto es lo que ofrece (o busca ofrecer):
- Transcripción lingüística. Convierte audio a texto basado en modelos de lenguaje acústico.
- Detección de rostro. Encuentra cuándo aparece cada rostro en un video.
- Diarización del hablante. Ubica y entiende quién habla cuándo.
- OCR. Extrae texto que aparece en el video como capa sobrepuesta, diapositivas o de fondo.
- Identificación de rostro. Entiende de quién es el rostro de la persona detectado.
- Detección de actividad vocal. Separa el ruido de fondo y la actividad de voz.
- Búsqueda contextual. Entiende el contexto de los resultados de búsqueda.
- Análisis del sentimiento. Entiende el nivel positivo vs negativo del habla o contenido escrito.