
(자료=카나나)
호랑이 리더보드는 웨이트앤바이어스(W&B)가 LLM의 한국어 성능 평가 결과를 공개하기 위해 운영하는 평가 리더보드이다. 언어 모델의 한국어 능력을 비교하고, 국내외 다양한 언어모델을 대상으로 한국어 범용 성능, 정렬성, 정보 탐색 능력을 종합 평가한다.
카카오 모델은 중형 모델 가운데 총점 0.691점을 기록하며 국내 모델 중 가장 높은 순위를 차지했다. 카카오 관계자는 “8b 이하 모델로 한정해 평가 지표를 구분한 결과 카카오의 모델이 최상위로 나타났다”며 “번역과 추론, 지식·질의응답, 구문해석 등의 벤치마크에서 좋은 성과를 거둬 다른 글로벌 모델과 비교해 우수한 경쟁력을 보유한 것을 입증했다”고 말했다.