카카오, 차세대 언어모델 ‘카나나-2’ 업데이트…에이전트 AI용 4종 오픈소스 공개

카카오
카카오가 차세대 언어모델 ‘카나나-2’를 업데이트하고 에이전트 AI 구현을 위한 4종의 오픈소스 모델을 새롭게 공개했다.(사진=카카오 제공)

카카오가 자체 기술로 개발한 차세대 언어모델 ‘카나나-2(Kanana-2)’를 업데이트하고, 에이전트형 인공지능(AI) 구현을 위한 4종의 모델을 오픈소스로 추가 공개했다.

카카오는 20일 카나나-2의 성능을 고도화한 신규 모델 4종을 글로벌 AI 개발 플랫폼 허깅페이스(Hugging Face)를 통해 공개했다고 밝혔다. 카나나-2는 지난해 12월 처음 오픈소스로 공개된 카카오의 대규모 언어모델로, 단순 대화형 AI를 넘어 실제 업무 수행이 가능한 에이전트 AI 구현을 목표로 개발되고 있다.

이번에 공개된 모델들은 고효율·저비용 구조를 기반으로 실질적인 에이전트 AI 활용에 초점을 맞췄다. 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 GPU 환경에서도 안정적으로 구동되도록 최적화돼, 중소기업과 학계 연구자들도 비교적 낮은 비용으로 고성능 AI를 활용할 수 있도록 설계됐다.

카나나-2는 ‘전문가 혼합(MoE, Mixture of Experts)’ 아키텍처를 적용한 것이 특징이다. 전체 파라미터 규모는 320억 개(32B)이지만, 실제 추론 과정에서는 상황에 맞는 약 30억 개(3B) 파라미터만 선택적으로 활성화한다. 이를 통해 대규모 모델의 지능 수준을 유지하면서도 연산 비용과 메모리 사용량을 크게 낮췄다.

카카오는 MoE 모델 학습에 필요한 핵심 커널을 자체 개발해 학습 속도를 높이고 메모리 효율을 개선했다. 학습 구조 역시 고도화했다. 사전 학습과 사후 학습 사이에 ‘미드 트레이닝(mid-training)’ 단계를 새롭게 도입하고, 기존 지식을 잊지 않도록 하는 ‘리플레이(replay)’ 기법을 적용해 한국어 처리 능력과 일반 상식 추론 성능을 안정적으로 유지했다.

이번에 공개된 모델은 ▲기본 모델 ▲지시 이행 모델 ▲추론 특화 모델 ▲미드 트레이닝 모델 등 총 4종이다. 특히 멀티턴 도구 호출 데이터를 학습시켜 복잡한 사용자 지시를 이해하고, 상황에 맞는 외부 도구를 스스로 선택·호출할 수 있도록 설계됐다.

카카오에 따르면 내부 성능 평가에서 카나나-2는 동급 경쟁 모델인 ‘Qwen-30B-A3B-Instruct-2507’ 대비 지시 이행 정확도, 멀티턴 도구 호출 성능, 한국어 처리 능력 등 주요 지표에서 우위를 보였다.

김병학 카카오 카나나 성과 리더는 “카나나-2는 실제 활용 가능한 에이전트 AI 구현을 목표로 설계된 모델”이라며 “범용 인프라 환경에서도 효율적으로 동작하는 오픈소스 모델 공개를 통해 국내 AI 연구 생태계와 기업들의 AI 도입에 실질적인 선택지를 제공하길 기대한다”고 말했다.

한편 카카오는 MoE 구조를 기반으로 한 수천억 파라미터 규모의 차세대 모델 ‘카나나-2-155b-a17b’ 개발을 위한 학습도 진행 중이다.

ⓒ 2024–2026 인트라매거진. 본 콘텐츠는 저작권법의 보호를 받으며, 무단 전재 및 재배포를 금합니다.

이어서 읽기

더 많은 이슈

다른 카테고리의 최신 기사