챗GPT, 클라우드, 제미니와 같은 대규모 언어 모델(LLM)들은 방대한 양의 언어 데이터를 학습해서 자연스러운 대화가 가능하도록 설계되었어요. 그렇지만 대규모 언어 모델을 언어 학습에 사용하는 건 그리 간단하지 않아요. 단순히 “이 학습자와 스페인어로 대화하시오.”라고 지시하는 것으로는 충분하지 않답니다.

릴리와의 영상통화 같은 AI에 기반한 기능을 개발하기 위해선, 대규모 언어 모델 스스로 아무렇게나 일을 수행하게 둘 수 없어요. 그 대신, 분명한 목표 달성을 위한 지시사항과 예측 가능한 문장 구조를 LLM에 제시해요. 그 덕분에 릴리와의 영상통화 하나하나가 재밌고 활기차게 느껴질 거예요—물론, 아주 훌륭한 말하기 연습 기회이기도 하고요. 

각 영상통화를 어떻게 디자인하나요? 

완벽한 영상통화 경험을 디자인하기 위해 듀오링고는 여러 우선 사항의 균형을 고려해야 해요:

  • 통화 내용이 학습자에게 적절한 CEFR (유럽언어 공통기준) 레벨이어야 해요.
  • 영상통화에 특정한 목적이 있어야 해요—이야기를 들려주거나, 의견을 묻거나, 뭔가를 가르쳐 주거나, 혹은 그냥 수다떨기일 수 있어요.
  • 통화하는 사람이 일반 AI 챗봇이 아닌, 듀오링고 캐릭터 릴리(빈정대기 좋아하는 이모 팬 십대 소녀)가 말하는 것처럼 느껴져야 해요.

이들 사이에 적절한 균형을 맞추기 위해, 프롬프트 (지시사항 목록)를 만들어 LLM에 제시해요. 이 프롬프트는 아래의 세 캐릭터가 함께하는 대화라고 보면 돼요.

  • 수행원: 이것은 AI 챗봇인 릴리의 역할이에요. 학습자인 유저가 릴리에게 말을 걸면, 릴리가 시스템으로부터 받은 지시사항에 맞게 대답하는 거죠. 
  • 시스템: 이것은 수행원의 코치에 해당해요. 시스템수행원(릴리)에게 전달하는 지시사항은 듀오링고의 학습 디자이너들에 의해 만들어져요. 이 지시사항에 따라 릴리의 응답 방식과 대화 내용이 정해지고요.
  • 사용자: 바로 여러분이에요—수행원(릴리)과 영상통화를 하며 대화하는 학습자를 가리켜요.

각각의 영상통화에서 릴리가 어떻게 행동해야 할지를 결정하는 명확한 지시사항들이 시스템에 전달돼요. 릴리의 성격과 배경에 관한 정보, 학습자가 뭐라고 말해야 할지 모를 경우 대처법, 학습자의 레벨에 맞게 말하기 속도 유지하기 등에 관한 정보가 지시사항에 포함된답니다.

또 중요한 점은, 대화의 기본 뼈대도 미리 제시한다는 거예요. 학습자가 릴리와 나누는 모든 대화는 때마다 다르지만, 모두 비슷한 형태를 따라요:

파트 1: 오프너
시스템
이 릴리에게 처음 대화 시작법을 알려줘요. 거의 모든 경우 학습 언어로 인사를 하죠. 듀오링고 엔지니어들이 각 CEFR 레벨에 맞는 다양한 인사표현을 저장해 두었답니다.

파트 2: 첫 질문
첫 질문을 통해 그 날의 통화 내용이 결정돼요. 릴리가 학습자에게 본인에 관한 새로운 사실을 물을지 몰라요. 이전 통화에서 나누었던 대화에 대해 다시 물을 수도 있고요. 혹은 학습 언어의 문화에 관련된 정보를 공유할 수도 있어요.

파트 3: 대화
대화 주제가 정해졌으니 이제 릴리와 학습자가 자유롭게 대화를 나눠요. 시스템이 릴리에게 준 지시사항에 따라, 릴리는 학습자가 말한 내용에 반응하고 자연스럽게 대화를 계속해요.

파트 4: 통화 마무리
대화를 몇 번 주고 받고난 후에는, 시스템이 릴리에게 이제 통화를 마무리하라는 메시지를 보내요. “이제 통화를 끝낼 시간이에요.”라고 릴리의 귀에 속삭이는 거죠. 통화가 너무 오래 계속되지 않고, 적정한 때에 마무리되도록 해주는 거랍니다. 

영상통화 이면에서는 무슨 일이 벌어지나요?

릴리의 기억력

릴리와 영상통화를 몇 번 해봤다면 릴리가 이전 통화 내용을 언급할 때, “어떻게 릴리가 나에 대한 걸 기억하지?!” 라는 의문이 들었을지도 몰라요. 이게 가능한 이유가 다 있답니다. 영상통화가 하나 끝나고 나면, 그 대화 내용이 LLM에 전달돼요. 그리고 “유저에 대해 무슨 중요한 정보를 배웠나요?”라고 질문해요. 수집된 정보는 유저의 “정보 목록”에 저장돼요. 다음 영상통화 시, 업데이트된 정보 목록이 시스템이 릴리에게 주는 지시사항에 포함된답니다. 

다시 말해, 릴리가 통화를 시작하기 전에 시스템이 릴리에게 이렇게 얘기하는 것과 같아요. “이 유저를 기억하나요? 여기 유저의 정보 목록이 있어요: 이 유저는 개 두 마리가 있고, 건축학을 공부하고, 가장 좋아하는 음식은 타코예요.” 위의 정보를 전달받은 릴리는 아마도 이렇게 얘기할 거예요. “당신의 개들은 잘 있어요?” 또는 “요즘 괜찮은 타코 먹어봤어요?” 덕분에 통화가 좀 더 사적이고 친근하게 느껴질 수 있죠. 

첫 질문 생성하기  

첫 질문은 대화 시작의 중요한 도약점이에요. 학습자에게 꼭 맞는 첫 질문을 고르는 게 중요하죠: 학습자가 배우고 있는 내용과 연관이 있어야 하고, 적정 난이도여야 하며, 좋은 대화를 이끌어낼 만한 적절한 질문이어야 해요. 이 조건을 모두 충족하기 위해, 정말 세세한 지시사항을 전달해줘야 해요. 오로지 첫 시작 질문을 고르기 위해서 말이죠!

사실, 여러분의 영상통화 벨이 울리는 와중에, 시스템은 첫 질문을 생성 중이랍니다.

영상통화 준비 과정
안경을 쓴 듀오가 컴퓨터 앞에 앉아 있는 모습 안녕하세요, LLM! 수행원(릴리)이 학습자에게 물을 질문을 만들어야 해요.
  • 질문은 학습자의 CEFR 레벨에 맞아야 해요.
  • 질문에 다음 단어들을 포함하세요: 음악, 좋아하다.
  • 질문은 … [그 외 다른 조건들] 해야 해요.
영상통화 중인 릴리의 모습. 질문이 여기 있어요!

"What kind of music do you like listening to?"
(어떤 음악을 듣는 걸 좋아해요?)

“영상통화 준비 과정”에서 생성된 이 질문을 이제 “메인 통화 내용”(시스템이 릴리에게 학습자와의 대화를 이끄는 법에 관한 지시를 내리는 곳)에 전달해요.

메인 통화 내용
안경을 쓴 듀오가 컴퓨터 앞에 앉아 있는 모습 당신은 릴리예요. 당신에 관한 정보가 여기 있어요:
  • 당신은 십대 소녀예요.
  • 당신은 빈정대는 걸 아주 좋아해요.
  • 당신은 내성적이에요.
당신은 A2 CEFR 레벨인 학습자와 통화 중이에요. 학습자에 대한 정보가 여기 있어요:
  • 그에게 개 두 마리가 있어요.
  • 그는 건축학을 공부 중이에요.
  • 그는 타코를 제일 좋아해요.
다음 오프너를 사용해 대화를 시작하세요: “Hey!”
그다음 이 첫 질문을 하세요: “What kind of music do you like listening to?”
영상통화 중인 릴리의 모습. 알겠어요. 지금 학습자와 통화를 시작할게요.

"Hey!"

릴리와의 영상통화가 개발되고 진화하면서 배운 사실은, 첫 질문 생성을 위한 지시사항을 메인 대화 내용과 따로 분리해 LLM에게 전달하는 게 중요하단 점이에요. 분리하지 않고 지시사항을 함께 줄 경우, LLM이 종종 과부하되어 원치 않는 결과를 초래해요—너무 복잡한 문장이 생성되거나 혹은 “영상통화 준비 과정”에서 지시한 어휘가 문장에 불포함되는 경우처럼요. 사람과 비슷해요: 아침에 업무가 오십 개 주어졌다면, 아마 그 중 몇 개는 잊어버릴 거예요—아니면 오십 개의 모든 업무를 건성으로 해내든지요. 듀오링고는 최상의 기능을 원하기 때문에, 첫 질문을 따로 분리해 준비하는 거랍니다.  

통화 내용 평가하기

첫 질문만 중요한 게 아니에요—듀오링고가 원하는 건 영상통화 내내 릴리가 실제 통화처럼 다양하게 바로바로 반응하는 거예요! 

올해 초에 발견한 사실이 있어요. 학습자들은 종종 릴리가 시작한 대화 주제에 대해 얘기하길 원치 않아요. 대신 학습자는 이렇게 말해요. “릴리, 그거 알아요? 제가 스페인어 과정을 모두 완료했어요!” 그리고 릴리는 이렇게 응답해요. “멋지네요. 스위스의 민속음악에 대해 들어봤어요?” 🫣

학습자가 대화를 이끄는 걸 돕기 위해, 영상통화에 지시사항을 하나 추가했어요. “학습자가 지금 이 대화를 이끌고 싶어하는 것 같나요? 그렇다면, 말하려고 했던 대화 주제를 무시하세요.” LLM은 영상통화 도중에도 끊임없이 생각하며 일하고 있기 때문에, 이러한 통화 내용 중간 평가가 효과를 볼 거라고 믿어요. 결과적으로 더 나은 영상통화 경험이 될 수 있을 거예요.

통화 내용 중간 평가 단계에서, 시스템은 학습자가 말한 내용을 보고 릴리에게 질문을 던짐으로써 대화가 재미있고 잘 진행되도록 도와요:

통화 내용 중간 평가
안경을 쓴 듀오가 컴퓨터 앞에 앉아 있는 모습 안녕하세요, 릴리! 학습자가 방금 말한 내용과 관련해 다음 사항을 고려하세요:
  • 학습자가 지금 릴리가 좋아하는 것에 대해 말했나요? 그렇다면, 신나게 반응하세요!
  • 학습자가 부적절한 것에 대해 얘기했나요? 그렇다면, 지금 바로 통화를 종료하세요!
  • 학습자가 잘 이해하지 못하는 것 같나요? 그렇다면 방금 말한 내용을 좀 더 쉽게 얘기해주세요!
영상통화 중인 릴리의 모습. 알겠어요! 방금 학습자가 기타를 아주 잘 친다고 말했어요. 그에 대한 제 대답이 여기 있어요:

“Wow, I'm actually impressed. What’s your favorite song to play?”
(우와, 놀라운 걸요. 기타칠 때 제일 좋아하는 노래가 뭐예요?)

릴리와의 영상통화는 가장 스마트한 말하기 연습법이에요!

앞서 설명한 내용이 좀 복잡한가요? 실제로 그래요! 여러분의 학습 레벨에 딱 맞는 통화 경험을 제공하기 위해 저희 듀오링고 팀은 계속해서 영상통화의 질을 향상하고, AI는 새로운 길을 개척해 나갈 거예요. 여러분은 말하기에 대한 두려움을 떨치고, 릴리와 말하기 연습만 하면 돼요!