Ouça o novo programa de IA do Google Talk Like a Human e escreva músicas
O DeepMind do Google cria IA que supera os sintetizadores de voz existentes.

Empresa de inteligência artificial de propriedade do Google DeepMind apresentado uma rede neural profunda que gera uma fala incrivelmente parecida com a humana. Chamado WaveNet , esta IA representa um avanço significativo em relação aos sintetizadores de voz existentes. Além do mais, ele pode escrever música clássica muito boa.
DeepMind é uma empresa britânica, anteriormente conhecida por criar software de IA de aprendizado de máquina que venceu o campeão mundial do jogo notoriamente complexo Vai . O aprendizado de máquina permite que os sistemas de computador aprendam sozinhos e façam previsões com base nos dados coletados.
A empresa afirma que seu WaveNet cria uma fala que pode imitar qualquer voz humana e fecha a lacuna com o desempenho da fala humana ao mais de 50% . O estudo de teste cego de 500 pessoas do Google encontrou pessoas avaliando o discurso em inglês da WaveNet em um 4,21 (5 sendo fala humana realista), enquanto a fala concatenada obteve um 3,86 e paramétrico e ainda pior 3,67 .
O WaveNet também gerou discurso em mandarim, que obteve resultados semelhantes.
Eles fizeram isso re-imaginando a conversão de texto em voz usada atualmente ( TTS ) processos. Os dois mais comuns são concatenativo TTS, usado pela Siri da Apple, que envolve fragmentos de fala pré-gravados, e paramétrico TTS, que soa ainda menos natural, obtendo a fala gerada por meio de algoritmos de computador.
O que é diferente sobre o WaveNet é que ele pode modelar diretamente o forma de onda bruta de um sinal de áudio, uma tarefa extremamente complicada que exigia uma nova rede neural. O WaveNet aprende com as gravações de voz e, em seguida, cria a fala por conta própria. Essa independência também permite que o programa gere outros tipos de áudio, como música.
Para reforçar sua afirmação, DeepMind lançou alguns exemplos, comparando suas WaveNets com amostras feitas por concatenar e TTS paramétrico. Você é o juíz.
Paramétrico:
E agora, isso é o que o WaveNet gerou:
Depois de ser treinado em um conjunto de dados de música clássica de piano, o WaveNet produziu suas próprias criações musicais intrigantes:
Quais são as implicações desta nova tecnologia? Embora também signifique que nossos eventuais overlords robóticos sejam mais fáceis de conversar, assistentes virtuais de IA como Siri ou Cortana poderiam se beneficiar mais cedo. O Google não está prometendo que isso vai direto para esses aplicativos, no entanto, já que o WaveNet requer um grande poder de computação.
Esta conquista mostra novamente o potencial das redes neurais da DeepMind que podem e estão sendo usadas para detecção de fraude e spam, reconhecimento de escrita, pesquisa de imagens, tradução e outras tarefas.
DeepMind também fez uma série de centros de dados do Google usar energia de forma mais eficiente , reduzindo sua conta de luz. Anteriormente, DeepMind treinou sua IA para vença dezenas de videogames .
Em uma mudança muito Google, o artigo no WaveNet está disponível no Google Drive aqui.
Quer saber mais sobre DeepMind? Confira este vídeo:
Compartilhar: