O trabalho de Rafael Valle, 40, está no futuro: ele busca desenvolver uma inteligência artificial geral de áudio, um sistema multimodal capaz de imitar vozes humanas, vocalizações de animais e até melodias musicais inéditas.
O brasileiro, que é músico regente de formação, foi contratado pela Meta, empresa dona do Facebook, para integrar um laboratório dedicado à criação da chamada “superinteligência”. A proposta é alcançar um patamar no qual a IA supere as capacidades humanas. A iniciativa, liderada pelo CEO Mark Zuckerberg, envolve bilhões de dólares e talentos vindos da OpenAI, Nvidia e Google.
Leia: Sindpd convida trabalhadores da Ambev Tech para o On Fire em Campinas
Valle é um dos autores da tecnologia que tornou possível gerar voz em poucos segundos, avanço fundamental para que inteligências artificiais possam conversar em tempo real. “Não faria sentido dizer algo e esperar um minuto [para ter a resposta]”, afirma.
Na Meta, o brasileiro integra um time de cerca de 50 pessoas que busca desenvolver uma IA multimodal, capaz de interagir por texto, imagem e som. Ele começou na empresa no último dia 7 e conta que a equipe ainda está definindo uma rotina de trabalho. “Vamos trabalhar tanto com pesquisas de longo prazo sobre os caminhos para alcançar a superinteligência como também na criação de produtos para o grande público.”
Valle vê vantagens na mudança: na Nvidia, sua antiga empresa, o foco estava em desenvolver tecnologia para outras empresas; já na Meta, ele espera alcançar diretamente mais de 2 bilhões de usuários. Ele também valoriza a possibilidade de colaborar com pesquisadores próximos de Ilya Sutskever, cofundador da OpenAI, a quem chama de “profeta da inteligência artificial”.
Sutskever deixou a empresa após uma tentativa de derrubar o CEO Sam Altman e fundou a startup Safe Superintelligence ao lado do engenheiro Daniel Gross, também recrutado por Zuckerberg.
Segundo Valle, o Vale do Silício já opera com IAs superinteligentes. Ele cita como exemplo a identificação de proteínas pelo AlphaFold2 do Google, tarefa que, segundo ele, seria impossível para um humano realizar no mesmo tempo e que foi reconhecida com o Prêmio Nobel de Química.
Timbre e tom de voz
Apesar dos avanços, Valle afirma que a inteligência das máquinas é radicalmente diferente da humana. “É como aquela analogia da barata querendo compreender a música dos homens, ela jamais conseguirá, está além da compreensão”, diz. Ainda assim, ele acredita que as pessoas poderão se beneficiar da IA mesmo sem entender seu funcionamento. “É como as teorias de Albert Einstein sobre o universo que as pessoas só conseguiram provar empiricamente anos depois.”
Graduado em regência pela Universidade Federal do Rio de Janeiro, Valle trabalhou na orquestra de Jocy de Oliveira antes de se interessar por tecnologia. A mudança de rumo começou após a leitura de um livro genérico sobre inteligência artificial, ainda nos anos 2000. “Foi quando pensei: dá para fazer máquinas que fazem música”, relembra. “Fui inocente”, completa.
Seu envolvimento com IA começou no doutorado iniciado em 2012 na Universidade de Berkeley, na Califórnia, após mestrado na Alemanha. Nos EUA, tentou criar um sistema capaz de reconhecer vozes clonadas, usadas em golpes e materiais difamatórios. “Eu já fazia esta pergunta: a inteligência artificial para gerar som, que ainda não era feita sob a perspectiva de imitar, não confundiria todo mundo?”
Hoje, graças à tecnologia que ajudou a desenvolver, é possível copiar timbre, tom e ritmo da fala de alguém com apenas três segundos de áudio. Por isso, ele acredita que é impossível criar um sistema de IA que detecte automaticamente se uma voz é sintética ou real.
“O único jeito de garantir isso seria um sistema de controle centralizado, com acesso a todas as falas das pessoas e áudios gerados por inteligência artificial, o que é eticamente inviável.” Como alternativa, defende o uso de selos obrigatórios de autenticação, prática já adotada por empresas como Google e OpenAI.
Valle começou na Nvidia em 2014, quando pesquisadores da DeepMind já indicavam que o futuro da IA estava na combinação de dados da internet com redes neurais. Em mais de dez anos na empresa, ele participou da construção de bases tecnológicas para grandes modelos de linguagem voltados ao som. Seu trabalho contribuiu para ferramentas como tradução em tempo real com timbres mais naturais e vozes fluídas.
Antes de sair da Nvidia, Valle concluiu seu projeto mais ambicioso: o modelo Fugatto, uma IA generalista de áudio capaz de reproduzir falas, ruídos, sons de animais, instrumentos e até sonoridades inexistentes.
A ideia surgiu há três anos, como uma brincadeira com a esposa. “O que vamos fazer quando nosso filho, que vai ser meio doido igual à gente, pedir o som de um latido de um saxofone?” O “latido do saxofone” apareceu, de fato, no artigo de lançamento da IA, divulgado em 25 de abril. O modelo foi treinado apenas com dados sonoros, abordagem semelhante à que originou o GPT, treinado para prever a próxima palavra em um texto.
Campanha Salarial começa no segundo semestre
A Campanha Salarial 2026 do Sindpd começa no segundo semestre deste ano e o seu lançamento promete ser em alto estilo! Vem aí o Sindpd On Fire, uma experiência inédita e ousada, exclusiva para sócios e contribuintes do sindicato e seus convidados!
Os ingressos para o evento de Campinas já começaram a ser emitidos! Não perca tempo e garante o seu lugar! O Sindpd vai promover o maior open churrasco do Brasil, com shows ao vivo com Fernando e Sorocaba em grandes encontros que prometem fazer história.
Já estão confirmados quatro eventos, em Campinas (16/08), Sorocaba (19/10), Ribeirão Preto (26/10) e São Paulo (15/11)! (Acesse o site oficial do Sindpd On Fire e saiba tudo)
Vale lembrar que é na campanha salarial que são definidas as reivindicações da categoria a serem levadas para a mesa de negociação com os patrões, para a celebração da próxima Convenção Coletiva de Trabalho (CCT).
Os dois eixos centrais da pauta deste ano já estão definidos: o fim da escala 6×1 no setor de TI paulista e a conquista de aumento real nos salários, demandas que refletem a busca do Sindpd por melhores condições de trabalho e pela valorização dos profissionais de TI.
(Com informações de Folha e S. Paulo)
(Foto: Reprodução/Freepik)