Agora você pode ouvir um podcast com Joe Rogan e Steve Jobs graças à IA

A empresa de IA Play.ht comercializa seu produto com uma ideia incomum: em um podcast gerado por IA, Appleo co-fundador Steve Jobs, que morreu em 2011, fala com a estrela do podcast Joe Rogan.

As vozes sintéticas fizeram um enorme progresso nos últimos anos graças ao aprendizado de máquina: a gagueira robótica entrecortada há muito tempo deu lugar à fala fluente que é cada vez mais dinâmico na entonação e, portanto, mais emocional .

Vozes e script são gerados com AI

A empresa Play.ht demonstra isso em um novo projeto de podcast gerado inteiramente com IA. A Play.ht vende serviços para vozes mecânicas em vários níveis e formatos de qualidade. Por exemplo, um serviço Play.ht lê automaticamente artigos de blog com uma voz mais ou menos natural.

“Na Play.ht, acreditamos em um futuro em que toda a criação de conteúdo será gerada por IA, mas guiada por humanos, e o trabalho mais criativo dependerá da capacidade do humano de articular a criação desejada à máquina”, escreve a empresa.

As vozes no podcast são renderizadas usando o recurso “Ultra-realistic Voices” do Play.ht. Segundo a empresa, esta é “a última geração” de vozes de máquinas que são “quase indistinguíveis” das vozes humanas.

Para treinar os geradores de voz, a empresa usou dados de áudio disponíveis online de Rogan e Jobs. Joe Rogan, em particular, oferece uma grande quantidade de material de treinamento com seus inúmeros podcasts de vídeo. No passado, já houve tentativas bem-sucedidas de substituir Rogan por conteúdo gerado por IA.

Play.ht gerou o script do podcast usando modelos de linguagem ajustados. Para o episódio de Steve Jobs, a empresa treinou um modo de linguagem com a biografia de Jobs e também incorporou “todas as gravações que pudessem ser encontradas online” no treinamento.

Para o futuro, o Play.ht está coletando ideias de usuários para podcasts mais incomuns gerados por IA. No topo da lista é atualmente um podcast entre Buda e Einstein.

O projeto de podcast do Play.ht é apenas um exemplo que demonstra o progresso das vozes sintéticas e do áudio AI em geral. Semelhante a geradores de imagens como DALL-E 2 ou meio da jornada , O áudio gerado por IA pode transformar os mercados de trabalho . Recentemente, os pesquisadores da Meta introduziram um novo Sistema de IA que pode gerar áudio com base em texto .