Resultado de imagen para IA google
Nosotros, los humanos, a menudo nos enfrentamos a un momento difícil para distinguir una voz en particular en una reunión de personas. Imagine lo difícil que es para un micrófono identificar sonidos distintos, y esto se observa en los casos en que un altavoz inteligente recibe instrucciones en fiestas en casas o lugares concurridos.

Pero parece que los humanos están a punto de perder su supremacía cuando se trata de reconocimiento de voz. Una nueva tecnología creada por Google ahora ayudará a su inteligencia artificial a captar diferentes voces cuando se lo hable de forma simultánea.



Este desarrollo pionero en el campo del reconocimiento de voz ahora permitirá a los asistentes virtuales basados en inteligencia artificial identificar una voz particular en la multitud y comprenderla con éxito.

El miércoles, los investigadores de Google dieron a conocer esta increíble y simultánea tecnología aterradora. El equipo había estado trabajando durante mucho tiempo para aislar las fuentes de audio como el habla en los videos, algo que los sistemas automatizados tienen dificultades.

¿Cómo funciona la nueva IA de reconocimiento de voz de Google?

Este desarrollo pionero en el campo del reconocimiento de voz ahora permitirá a los asistentes virtuales basados en inteligencia artificial identificar una voz particular en la multitud y comprenderla con éxito.

El miércoles, los investigadores de Google dieron a conocer esta increíble y simultánea tecnología aterradora. El equipo había estado trabajando durante mucho tiempo para aislar las fuentes de audio como el habla en los videos, algo que los sistemas automatizados tienen dificultades.

¿Cómo funciona la nueva IA de reconocimiento de voz de Google?
Google Audio Video Speech Separation Model

El sistema funciona en un modelo de separación de voz audiovisual que puede identificar voces al monitorear las caras de las personas cuando hablan. Su modelo de red neuronal fue entrenado para seleccionar sonidos de diferentes individuos a través de 'fiestas falsas' creadas por los investigadores.



Sin embargo, las implicaciones de privacidad de la nueva tecnología de reconocimiento de voz de Google son bastante aterradoras. Si se implementa a gran escala, este sistema podría ser utilizado por terceros para espiar a las personas escuchando su discurso. Aunque requeriría mejoras mucho mayores para lograrlo, tal futuro podría no estar lejos.