Voice Engine: novo modelo da OpenAI consegue clonar vozes humanas
Recentemente, a OpenAI apresentou a sua mais nova ferramenta de inteligência artificial, o Voice Engine. Na prática, o novo modelo de IA é capaz de copiar e reproduzir vozes humanas com alto grau de fidelidade a partir de clipes de até 15 segundos. Contudo, sua disponibilidade ainda é limitada.
Assim como fez como modelo de geração de vídeos com base em prompts de texto, Sora, a empresa está restringindo a disponibilidade do novo modelo de IA. Isso porque a startup considera que o uso indevido pode causar prejuízos à sociedade, como circulação de desinformação e aplicação de golpes.
No , a startup ainda cita potenciais implicações da ferramenta. Um exemplo são as eleições que ocorrem neste ano nos EUA, Brasil e outras partes do mundo. Por isso, a OpenAI está trabalhando com entidades governamentais, de mídia, entretenimento, educação e sociedade civil para entender as potenciais ameaças antes de liberar o serviço de maneira mais ampla.
Aplicações do Voice Engine
Segundo a OpenAI, o Voice Engine pode ser benéfico para tradução automática de conteúdos em vídeo em plataformas de internet. Com o recurso disponível, os criadores poderiam utilizá-lo para usar a própria voz em traduções para outros idiomas e atingir novos públicos.
Além disso, a empresa sugeriu utilizar sua criação para ajudar pacientes portadores de problemas na fala ou que perderam a voz. Assim, eles podem se comunicar de forma mais eficiente.
Além disso, entidades que prestam serviço de ajuda humanitária podem ter maior êxito em seus serviços. Assim, elas podem se conectar mais profundamente com as comunidades onde oferecem assistência.
A empresa ainda revelou que a ferramenta está finalizada desde o final de 2022. Porém, desde então, vem trabalhando em testes com alguns poucos parceiros “confiáveis”.
No momento, ainda não há previsão de quando a OpenAI vai disponibilizar o Voice Engine para uma utilização mais ampla. O que sabemos até o momento é que ele não deve ser totalmente liberado para o público geral em razão de seus potenciais riscos à sociedade.