Ouça o novo programa de IA do Google Talk Like a Human e escreva músicas

O DeepMind do Google cria IA que supera os sintetizadores de voz existentes.



Ouça o novo programa de IA do Google Talk Like a Human e escreva músicas

Empresa de inteligência artificial de propriedade do Google DeepMind apresentado uma rede neural profunda que gera uma fala incrivelmente parecida com a humana. Chamado WaveNet , esta IA representa um avanço significativo em relação aos sintetizadores de voz existentes. Além do mais, ele pode escrever música clássica muito boa.


DeepMind é uma empresa britânica, anteriormente conhecida por criar software de IA de aprendizado de máquina que venceu o campeão mundial do jogo notoriamente complexo Vai . O aprendizado de máquina permite que os sistemas de computador aprendam sozinhos e façam previsões com base nos dados coletados.



A empresa afirma que seu WaveNet cria uma fala que pode imitar qualquer voz humana e fecha a lacuna com o desempenho da fala humana ao mais de 50% . O estudo de teste cego de 500 pessoas do Google encontrou pessoas avaliando o discurso em inglês da WaveNet em um 4,21 (5 sendo fala humana realista), enquanto a fala concatenada obteve um 3,86 e paramétrico e ainda pior 3,67 .

O WaveNet também gerou discurso em mandarim, que obteve resultados semelhantes.



Eles fizeram isso re-imaginando a conversão de texto em voz usada atualmente ( TTS ) processos. Os dois mais comuns são concatenativo TTS, usado pela Siri da Apple, que envolve fragmentos de fala pré-gravados, e paramétrico TTS, que soa ainda menos natural, obtendo a fala gerada por meio de algoritmos de computador.

O que é diferente sobre o WaveNet é que ele pode modelar diretamente o forma de onda bruta de um sinal de áudio, uma tarefa extremamente complicada que exigia uma nova rede neural. O WaveNet aprende com as gravações de voz e, em seguida, cria a fala por conta própria. Essa independência também permite que o programa gere outros tipos de áudio, como música.

Para reforçar sua afirmação, DeepMind lançou alguns exemplos, comparando suas WaveNets com amostras feitas por concatenar e TTS paramétrico. Você é o juíz.



Paramétrico:

parametric-1.wav

parametric-2.wav

E agora, isso é o que o WaveNet gerou:

wavenet-1.wav



wavenet-2.wav

Depois de ser treinado em um conjunto de dados de música clássica de piano, o WaveNet produziu suas próprias criações musicais intrigantes:

sample_1.wav

sample_2.wav

sample_3.wav

Quais são as implicações desta nova tecnologia? Embora também signifique que nossos eventuais overlords robóticos sejam mais fáceis de conversar, assistentes virtuais de IA como Siri ou Cortana poderiam se beneficiar mais cedo. O Google não está prometendo que isso vai direto para esses aplicativos, no entanto, já que o WaveNet requer um grande poder de computação.

Esta conquista mostra novamente o potencial das redes neurais da DeepMind que podem e estão sendo usadas para detecção de fraude e spam, reconhecimento de escrita, pesquisa de imagens, tradução e outras tarefas.

DeepMind também fez uma série de centros de dados do Google usar energia de forma mais eficiente , reduzindo sua conta de luz. Anteriormente, DeepMind treinou sua IA para vença dezenas de videogames .

Em uma mudança muito Google, o artigo no WaveNet está disponível no Google Drive aqui.

Quer saber mais sobre DeepMind? Confira este vídeo:

Compartilhar:

Seu Horóscopo Para Amanhã

Idéias Frescas

Categoria

Outro

13-8

Cultura E Religião

Alquimista Cidade

Livros Gov-Civ-Guarda.pt

Gov-Civ-Guarda.pt Ao Vivo

Patrocinado Pela Fundação Charles Koch

Coronavírus

Ciência Surpreendente

Futuro Da Aprendizagem

Engrenagem

Mapas Estranhos

Patrocinadas

Patrocinado Pelo Institute For Humane Studies

Patrocinado Pela Intel The Nantucket Project

Patrocinado Pela Fundação John Templeton

Patrocinado Pela Kenzie Academy

Tecnologia E Inovação

Política E Atualidades

Mente E Cérebro

Notícias / Social

Patrocinado Pela Northwell Health

Parcerias

Sexo E Relacionamentos

Crescimento Pessoal

Podcasts Do Think Again

Vídeos

Patrocinado Por Sim. Cada Criança.

Geografia E Viagens

Filosofia E Religião

Entretenimento E Cultura Pop

Política, Lei E Governo

Ciência

Estilos De Vida E Questões Sociais

Tecnologia

Saúde E Medicina

Literatura

Artes Visuais

Lista

Desmistificado

História Do Mundo

Esportes E Recreação

Holofote

Companheiro

#wtfact

Pensadores Convidados

Saúde

O Presente

O Passado

Ciência Dura

O Futuro

Começa Com Um Estrondo

Alta Cultura

Neuropsicologia

Grande Pensamento+

Vida

Pensamento

Liderança

Habilidades Inteligentes

Arquivo Pessimistas

Começa com um estrondo

Grande Pensamento+

Neuropsicologia

Ciência dura

O futuro

Mapas estranhos

Habilidades Inteligentes

O passado

Pensamento

O poço

Saúde

Vida

Outro

Alta cultura

A Curva de Aprendizagem

Arquivo Pessimistas

O presente

Patrocinadas

A curva de aprendizado

Liderança

ciência difícil

De outros

Pensando

Arquivo dos Pessimistas

Negócios

Artes E Cultura

Recomendado