Grandes modelos de linguagem (em inglês Large Language Models ou LLMs), como ChatGPT, Claude e Gemini, foram treinados com enormes quantidades de dados de linguagem para gerar conversas de forma natural. Mas usá-los para ensinar pessoas que estão aprendendo (post em inglês) não é tão fácil quanto dizer: “Ei! Fale com este aluno em espanhol!”.
Para desenvolver recursos de IA como a Videochamada com a Lily, não podemos simplesmente deixar o modelo agir livremente. Em vez disso, usamos instruções direcionadas e uma estrutura previsível para garantir que cada chamada com Lily traga alegria e ousadia — e, claro, a oportunidade para praticar conversação.
Como desenvolvemos cada Videochamada
Ao desenvolver a experiência de chamada perfeita, temos muitas prioridades para equilibrar:
- Precisa estar no nível CEFR apropriado.
- Ela precisa ter um propósito, como contar uma história, pedir sua opinião, ensinar algo ou simplesmente conversar.
- Precisa parecer que está vindo da Lily, uma adolescente emo sarcástica (post em inglês), não de um chatbot genérico de IA.
Para alcançar o equilíbrio certo, nós criamos um prompt (ou conjunto de instruções) para o LLM. Você pode pensar no prompt como uma conversa envolvendo três personagens:
- Assistente: é Lily, a bot de IA que reage ao que você, o Usuário, diz de acordo com as instruções do Sistema.
- Sistema: é como o personal trainer do Assistente. Os Designers de Aprendizado do Duolingo escrevem as instruções que o Sistema diz para o Assistente (Lily) sobre como agir e o que dizer.
- Usuário: é você — a pessoa que interage com o Assistente (Lily).
Em todas as nossas chamadas, fornecemos ao Sistema um conjunto robusto de instruções sobre como Lily deve se comportar. Essas instruções incluem informações sobre a personalidade e o histórico de Lily, dizem a ela como te ajudar se você estiver empacado, garantem que ela fale no nível correto e mais.
Além disso, tem algo muito importante, incluímos um roteiro básico para a conversa. Embora cada conversa que você tenha com Lily seja única, todas seguem um formato semelhante:
Parte 1: Abertura
O Sistema diz à Lily o que dizer primeiro. Quase sempre é uma saudação no idioma de destino. Nossos engenheiros criaram um ciclo de saudações que Lily utilizará para cada nível CEFR.
Parte 2: Primeira pergunta
Isso define o cenário para o assunto da ligação. Lily pode perguntar algo novo sobre você, ela pode revisitar um tópico anterior, ou ela pode dizer que tem informações para compartilhar sobre a cultura do seu idioma-alvo.
Parte 3: Conversa
Lily e você podem então ir e voltar livremente pela conversa. O Sistema instruiu Lily a reagir ao que você diz e depois continuar a conversa naturalmente.
Parte 4: Fechamento
Depois de um certo número de idas e vindas, entra em ação um programa que os engenheiros criaram em que o Sistema intervém e sussurra no ouvido de Lily: “Psiu! Diga que é hora de ir.” Isso evita que a chamada continue para sempre.
Nos bastidores
A memória de Lily
Se você fez várias Videochamadas, pode se perguntar “Como a Lily se lembra disso sobre mim?!” quando ela menciona informações de chamadas anteriores. Isso acontece porque, depois que Lily desliga, pegamos a transcrição da chamada, mostramos para o LLM e perguntamos: “Que informação importante aprendemos sobre o Usuário?”. As informações coletadas são então adicionadas a uma Lista de Fatos. A lista atualizada passa a fazer parte das instruções que o Sistema dá para Lily durante sua próxima chamada.
Ou seja, antes de Lily começar a falar, o Sistema diz “Lembra deste Usuário? Aqui está uma Lista de Fatos: ele disse que tem dois cachorros, está estudando arquitetura e sua comida favorita são tacos.” Dessa forma, Lily pode perguntar “Como estão seus cachorros?” ou “Você experimentou algum taco bom recentemente?” para fazer a ligação parecer personalizada e mágica.
Criando a primeira pergunta
A primeira pergunta é um importante trampolim para a conversa. Queremos acertar: precisa ser relevante para o que você está aprendendo, precisa ter a dificuldade certa (post em inglês) e precisa preparar o cenário para uma boa conversa. Com todos esses critérios, temos que escrever instruções detalhadas especificamente sobre como escrever uma boa pergunta inicial!
Na verdade, quando aparece que Lily está te ligando é quando o Sistema está formulando a primeira pergunta.
Preparação da Conversa | |
---|---|
![]() |
Olá, LLM! Você precisa escrever uma pergunta que o Assistente (Lily) possa fazer ao aluno.
|
![]() |
Aqui está a pergunta!
“What kind of music do you like listening to?” |
Em seguida, pegamos essa pergunta da Preparação da Conversa e a introduzimos na Conversa Principal, onde o Sistema instrui Lily sobre como conduzir a conversa com você:
Conversa Principal | |
---|---|
![]() |
Você é Lily, aqui estão algumas informações sobre você:
Em seguida, diga esta primeira pergunta: “What kind of music do you like listening to?” |
![]() |
Eu entendo. Vou começar a conversa com o aluno agora.
“Hey!” |
À medida que as Videochamadas se desenvolveram e evoluíram, aprendemos que é importante para o LLM escrever a primeira pergunta separadamente. Quando incluímos as instruções para a primeira pergunta junto com as instruções para o resto da chamada, muitas vezes podemos sobrecarregar o LLM e obter resultados indesejáveis — como frases excessivamente complexas ou sem o vocabulário fornecido na Preparação da Conversa. É meio parecido para humanos: se lhe disserem para fazer cinquenta tarefas no início do dia, você provavelmente esquecerá de fazer algumas delas — ou talvez você faça todas as cinquenta de uma maneira incompleta. E como queremos tudo completinho, preparamos a primeira pergunta por conta própria.
Avaliando conversas
A primeira pergunta não é a única que importa — queremos que Lily reaja dinamicamente durante toda a chamada, a qualquer momento!
No início deste ano, vimos que às vezes os alunos não queriam falar sobre o assunto que Lily foi instruída a focar. Você diria “Você não vai acreditar, Lily! Acabei de completar o curso inteiro de espanhol!” e Lily responderia “Que legal. Você já ouviu falar sobre a música folclórica suíça?” 🫣
Para permitir que os alunos liderem a conversa, adicionamos uma verificação extra que diz “Parece que o aluno quer liderar esta conversa? Se sim, ignore o que você originalmente ia falar.” Temos grandes expectativas para essas avaliações durante a chamada, já que o LLM está sempre trabalhando — até mesmo durante a própria Videochamada — para garantir uma ótima experiência.
Na avaliação durante a chamada, o Sistema analisa o que você disse e faz perguntas a Lily para manter a conversa envolvente e no caminho certo:
Avaliação durante a chamada | |
---|---|
![]() |
Oi, Lily! Considere o seguinte para o que o aluno acabou de dizer a você:
|
![]() |
Entendi! O aluno acabou de mencionar que ele é muito bom em tocar violão. Aqui está minha reação ao que ele disse:
“Wow, I’m actually impressed. What’s your favorite song to play?” |
A prática de conversação mais inteligente por aí!
Tudo isso pode parecer complicado — porque é! À medida que nossa equipe continua a fazer ajustes e a IA continua a forjar novas trilhas, estamos ensinando Lily a acompanhar o seu nível e permitir que você pratique falar sem medo.