Nossos personagens finalmente estão ganhando voz. Neste post, vamos compartilhar como estamos criando vozes únicas para todo o nosso elenco.

Ilustração dos personagens do Duolingo correndo pelo espaço. Eles parecem animados e determinados.

É mais divertido aprender com essa turma

Depois que a nossa equipe de arte ilustrou, animou e colocou os personagens no aplicativo, percebemos que eles despertaram muito amor nas redes sociais. Esse entusiasmo nos motivou a dedicar ainda mais tempo ao nosso elenco para que ele realmente ganhasse vida.

Vimos uma oportunidade de tornar o aprendizado mais divertido e envolvente — e, assim, estreitar os laços entre o Duolingo e quem estuda com ele. Com isso, as pessoas poderiam continuar voltando para aprender e descobrir mais sobre os personagens por meio de uma narrativa interessante.

Agora, estamos incluindo vozes únicas para cada um. Além de dar mais personalidade, isso aumenta a exposição dos nossos alunos a jeitos variados de falar, o que também contribui para os estudos deles. Quando você usa um novo idioma na vida real, você interage com pessoas de diversas idades, gêneros e contextos. É por isso que ouvir vozes diferentes nas lições é tão importante, porque ajuda a desenvolver a flexibilidade na escuta para situações do dia a dia!

Então, quem são os personagens?

Para responder a essa pergunta, passamos muitos meses desenvolvendo os personagens e discutindo sua personalidade e biografia, assim como as relações entre eles. Ao mesmo tempo, estávamos escrevendo narrativas para o Duolingo Histórias com cada um, o que nos ajudou a descobrir mais sobre as suas essências.

Percebemos que a familiaridade com o elenco poderia ser um grande atalho no Histórias, já que temos limitações de tamanho e tipo de palavras e estruturas que podemos usar (especialmente para iniciantes). Mas com a personalidade forte e distinta de cada personagem e as dinâmicas entre eles, de repente abriu-se um caminho mais fácil para construir narrativas mais ricas. Em vez de ter que explicar as motivações da Lili em cada história, seu jeitinho indiferente e entediado já transmite uma ideia sutil de suas motivações, o que permite contar histórias cativantes, mesmo com uma linguagem de nível básico.

Lili e Duo conversam sem muita energia enquanto caminham.

Encontrando as vozes ideais

O próximo passo para dar vida aos personagens era encontrar vozes para eles. Por isso, estamos elaborando vozes customizadas que realmente demonstrem as características singulares de cada um, utilizando a conversão de texto para fala (text-to-speech, TTS na sigla em inglês). Estamos empolgados com o poder que a fala dessa turma tem de tornar a experiência de aprender idiomas mais envolvente, efetiva e até divertida.

Naturalmente, desenvolver vozes únicas para nove personagens em vários idiomas não é fácil, nem rápido. Levamos meses só para escolher o elenco das vozes em inglês, entre analisar os testes e discutir quais atores foram melhores em captar o espírito de cada um deles. Será que esta interpretação do Eddy ficou muito intelectual? Será que o Oscar deveria ter uma voz mais profunda e ressonante? E até onde será que a Lili pode ser apática sem afetar o aprendizado de forma negativa?

Depois de escolher os atores e fazer as gravações em inglês, usamos essas performances como modelo para o espanhol, francês, alemão e japonês. Mesmo com as vozes originais como referência, cada idioma trouxe novos desafios de criatividade e logística. Por exemplo, o sarcasmo soa diferente em japonês e em inglês. Nesse caso, a voz da Lili deveria ser diferente também? Com a nossa equipe de especialistas em linguagem, especialistas em fonética e consultores criativos, trabalhamos em todas as vozes para ter certeza de que elas estavam demonstrando a essência dos personagens de forma apropriada para cada cultura.

Algumas vozes dos outros idiomas soam quase idênticas àquelas do original em inglês. Em outras, colocamos mais ênfase em elementos específicos do jeito de ser de cada um. A Lin é um caso interessante disso: ela é indiferente e prática em japonês, mas em inglês parece estar sempre se divertindo.

Lin no palco tocando violão e cantando no microfone.

Construindo as vozes

Depois de escolher os atores e fazer as gravações com o jeitinho e o estilo de cada personagem, usamos aprendizado de máquina para criar vozes de TTS de última geração. Elas podem ser usadas para dizer qualquer frase do curso — até aquelas que ainda não foram escritas! Já existem ótimas tecnologias disponíveis para construir e desenvolver vozes, mas no Duolingo precisamos usá-las para ensinar idiomas, e esse é um uso bem diferente do que é feito em outros aplicativos.

Escrevemos as frases com cuidado para que as gravações englobassem todos os contextos necessários para as lições: diferentes combinações de sons na fala, frases de estrutura variada e todo o tipo de contexto, incluindo exclamações e palavras isoladas. Essa diversidade era necessária para representar todas as formas de linguagem que as pessoas encontram nos cursos. Também nos empenhamos em expandir os limites da tecnologia para conseguir o produto final que queríamos, em termos de entonação, ritmo e pausas, para tornar as vozes tão realistas e eficazes quanto possível para o aprendizado de idiomas.

Com as novas vozes, buscamos unir a expressividade dos artistas e as nossas necessidades muito específicas de ensino. Nas gravações, os atores tiveram que inventar cenários para dar significado a cada frase, e em alguns momentos esse "toque especial" acústico, como imaginar o personagem zangado, era um desafio para a tecnologia, que é feita para funcionar com um discurso mais neutro.

Também era muito importante conseguir combinar as gravações e as vozes de TTS com os objetivos das nossas lições. Para quem aprende no aplicativo, essas vozes precisam ser um modelo confiável de como pronunciar e usar o idioma. Por exemplo, na frase em inglês "I read the book" ("Eu leio o livro/Eu li o livro"), a palavra "read" tem uma pronúncia diferente em uma lição sobre o tempo presente ("I read the book [every night before bed]" ou "Eu leio o livro [toda noite antes de dormir]") e em uma lição sobre o tempo passado ("I read the book [last summer]" ou "Eu li o livro [no verão passado]"). Também foi um desafio chegar ao ritmo e entonação certos para cada tipo de frase. Em inglês, a nossa voz sobe e desce de um jeito muito particular e que varia muito dependendo do tipo de pergunta que fazemos: "Do you want to go?" ("Você quer ir?") tem outro ritmo quando comparada a "Where do you want to go?" ("Aonde você quer ir?"). As amostras de fala no sistema tinham que ser tão boas quanto as vozes; por isso, os especialistas em linguagem e os engenheiros uniram forças para alimentar o sistema com dicas e corrigir o discurso quando necessário.

Como podemos ouvir as novas vozes?

Quem estiver no curso de inglês pode ouvir as vozes de todos os personagens nas lições agora mesmo!

Ah, e se você estuda mais de um idioma no Duolingo, aproveite para ouvir várias interpretações diferentes do nosso elenco de personagens!