GPT-3 모델의 한국어 특화 버전…김일두 대표 “GPT 기술 사이즈 100배 규모로 키울 예정”
GPT-3는 인간과 AI가 자연어 기반으로 소통할 수 있는 AI 모델이다. 딥러닝의 한계를 끌어올려 차세대 AI 시대를 열었다고 평가받는 기술이다.
일례로 기존의 딥러닝 방식에서 감성 분석을 할 때 사람의 선호도를 파악하기 위해서는 엄청나게 많은 데이터를 확보하고, 좋음 또는 나쁨을 판단해 레이블링을 했었다. GPT 모델을 적용하면 추가 학습 없이 스스로 판단해 감정 분석을 할 수 있다. 예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약하는 것도 가능하다.
카카오브레인의 KoGPT는 GPT-3 모델의 한국어 특화 버전이다. 60억 개의 매개변수와 2000억 개 토큰의 한국어 데이터를 바탕으로 구축했다.
KoGPT는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. △주어진 문장의 긍정과 부정 판단 △긴 문장 한줄 요약 △문장을 추론해 결론 예측 △질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다.
김일두 카카오브레인 대표는 “앞으로 GPT 기술의 사이즈와 성능을 100배 규모로 키울 예정”이라며 “GPT를 오픈소스로 개방해 일반 대학이나 스타트업 등의 기술 접근성을 높일 것”이라고 전했다. 김 대표는 이어 “KoGPT에 이어 초거대 AI의 다양한 모델을 발표하는 등 지속적으로 혁신 기술을 공유하고 국내 IT 기술 발전과 연구 활성화에 기여해 다양한 사회 문제를 같이 해결하기 위해 노력할 것”이라고 덧붙였다.
박형민 기자 godyo@ilyo.co.kr