Google

WaveNet, el sistema que ayuda a que las máquinas “hablen” como un ser humano

Invstigadores de DeepMind anuncian un software que puede revolucionar la forma en la que los procesos informáticos y automátizados se relacionan con las personas gracias a un lenguaje más natural

lunes 12 de septiembre de 2016 - 11:59 am

Con la idea de materializar un acercamiento de la voz artificial hacia la más natural en las máquinas, investigadores de DeepMind, empresa propietaria de Google, anunciaron la creación de WaveNet, un programa informático capaz de generar voz sintética basado en Inteligencia Artificial y que se comporta de una similar a la de un ser humano.

Según sus creadores, puede permitir que una manera hable exactamente igual que una persona.

LEA MÁS  La derrota de Argentina ante Croacia fue el livestream en español más visto de la historia

Esta plataforma, que funciona como un sistema neuronal, rompe con la tradicional naturaleza robótica de la voz programada en los aparatos electrónicos para dotarle de naturalidad y matices propios del ser humano. El equipo de ingenieros asegura que el software puede “imitar a la perfección” una voz humana.

Las muestras de voz se impulsaron en diversos programas informáticos desde hace bastante tiempo, pero sintetizar y acercarse a una mayor naturalidad está resultando un gran desafío. Hasta el momento, la técnica común es una lectura virtual, una concatenación de texto a voz que combina fragmentos de un discurso grabado para generar las frases, que un sistema devuelve en función de la interacción realizada.

LEA MÁS  Encuentran la fuente de los nuevos gases que estaban destruyendo la capa de ozono

El principal problema generalmente es que este método no es capaz de alterar y modificar la base de datos y fragmentos existentes para crear algo desde cero, lo que provoca la situación actual: una voz robótica y enlatada. WaveNet intenta corregir esta situación.

Para ello utiliza un “enfoque totalmente diferente”, ya que es capaz de aprender. La idea es que se mueva sobre un contexto determinado, con sus matices lingüísticos, resolviendo incluso modos de expresión como la ironía o el sarcasmo, tal y como funcionan los sistemas neuronales.

LEA MÁS  Tecnología Nano Cell: ¿para qué sirve en tu Smart TV?
COMENTARIOS