A inteligência artificial (IA) mudou o jogo em muitos domínios, incluindo a tecnologia de modificação da voz.
O conceito envolve essencialmente tomar uma voz e modificá-la para recitar qualquer texto. O principal interveniente nesta tecnologia fascinante é a ElevenLabs, uma empresa que oferece uma ferramenta excecional de conversão de texto em voz.
O que é a ElevenLabs?
A ElevenLabs é uma empresa pioneira na investigação da síntese de voz, fundada por um antigo engenheiro de aprendizagem automática da Google e estratega de implantação da Palintir.
Embora a conversão de texto em voz seja uma parte essencial do plano da ElevenLabs, o objetivo final é criar uma ferramenta capaz de traduzir instantaneamente sons falados de uma língua para outra.
A empresa concebeu novos modelos de text-to-speech capazes de criar uma voz humana realista.
A sua missão, tal como descrita no seu sítio Web, é facilitar a assistência áudio multilingue a pedido em domínios como a educação, o streaming, os livros áudio, os jogos, os filmes e até as conversas em direto.
O que é a geração de voz por IA?
Em termos simples, a geração de voz de IA permite-lhe pedir a uma voz que recite o diálogo que lhe fornece. O software ElevenLabs gera vozes que se assemelham incrivelmente às vozes humanas.
A ElevenLabs oferece três opções de IA de voz: vozes « pré-construídas » gratuitas, um gerador de vozes (onde pode escolher o sexo, a idade e o sotaque) e uma voz « clonada » disponível apenas por subscrição. Tenha em atenção que a ferramenta de IA de voz da ElevenLabs está atualmente em fase beta.
Como é que utilizo uma voz da ElevenLabs?
A forma mais fácil de utilizar a ElevenLabs é através da sua ferramenta gratuita. Vá para o Site da Eleven Labs, crie uma conta usando seu endereço de e-mail, conta do Google ou conta do Facebook e siga as etapas abaixo:
- Clique em « Síntese de fala« .
- Em « Configurações« , selecione uma das vozes predefinidas (estão disponíveis opções masculinas e femininas).
- Adicione os cursores « Estabilidade » e « Clareza + Aprimoramento de similaridade » em « Configurações de fala ».
- Escolha « Eleven Multilingual » (para ter uma voz francesa).
- Digite o texto que pretende converter em voz.
- Clique em « Gerar« .
Quando o processo estiver concluído, a reprodução deve começar automaticamente. Caso contrário, clique em « Reproduzir ». Também pode descarregar a amostra gerada.
Como é que crio uma voz no Eleven Labs?
Se quiser criar uma nova voz, o ElevenLabs oferece um ecrã « VoiceLab« . Aqui pode criar uma nova voz com base nas predefinições:
- Clique em « Adicionar Voz » > « Design de Voz ».
- Especifique o sexo, idade e sotaque da sua voz
.
- Se necessário, ajuste o seletor « Intensidade do sotaque« .
- Insira o texto que pretende converter.
- Clique em « Gerar« .
Quando a conversão está concluída, pode ouvi-la e transferi-la.
Como é que clono uma voz com a Eleven Labs?
A caraterística principal do ElevenLabs é a ferramenta de clonagem de voz. Está reservada para utilizadores premiums. Note-se que o pacote mais barato custa apenas 5 euros.
Para utilizar a função de clonagem de voz, tem de ter um texto e uma amostra clara da sua voz. Quanto mais longa for a amostra (até 5 minutos), melhor. Depois, proceda da seguinte forma:
- No ecrã « VoiceLab », clique em « Adicionar uma voz » > « Clonagem instantânea de voz ».
- Definir um nome.
- Carregar uma amostra clicando ou arrastando um ficheiro (pode adicionar até 25 amostras para uma maior precisão).
- Clique em « Rótulos » e especifique uma chave + valor (por exemplo, Sotaque/Britânico) – pode repetir isto até cinco vezes.
- Digite uma descrição breve da voz.
- Confirme a sua concordância e, em seguida, clique em « Adicionar uma voz« .
Como é que utilizo uma voz artificial?
As utilizações potenciais da IA de voz com vozes predefinidas e clonadas são inúmeras.
Para além da tradução ao vivo, a ElevenLabs prevê várias aplicações, incluindo livros de áudio (possivelmente lidos por celebridades há muito falecidas), jogos de vídeo (que poupariam na contratação de actores de voz), música, conteúdos de autoajuda e muito mais.
É até possível criar um podcast com uma locução de IA. No entanto, tenha em mente que o resultado provavelmente será um pouco monótono.
A ElevenLabs também planeia introduzir uma funcionalidade de conversa por voz numa data posterior.
A última palavra
A ferramenta de voz da ElevenLabs oferece-nos algumas fascinantes possibilidades. É como fazer uma imitação, mas com uma voz clonada. Embora a utilização de vozes sem consentimento levante questões éticas, esta ferramenta oferece um enorme potencial. Acima de tudo, é fácil de utilizar e apresenta resultados impressionantes.
Este artigo fica por aqui. Quer saber mais sobre inteligência artificial? Consulte a nossa notícias e os nossos guias para se familiarizar com esta tecnologia do futuro.