logo
공유된 기사
"스태빌리티 AI, 초소형 언어 모델 '스테이블LM 제퍼 3B' 출시...온디바이스 AI 영역 확장"
스태빌리티 AI가 30억 매개변수의 대화형 대형언어모델 '스테이블LM 제퍼 3B(StableLM Zephyr 3B)'를 오픈 소스로 출시했다. 이 모델은 텍스트 생성, 요약, 콘텐츠 개인화를 지원하며, 작은 크기와 빠른 응답 시간으로 다양한 하드웨어에 배포 가능하며, 온디바이스 AI에 최적화된 것으로 평가되었다.

스테이블LM 제퍼 3B는 '직접 선호 최적화(DPO)'라는 강화 학습 방식을 사용하였으며, 이는 스탠포드대학교 연구진이 발표한 강화 학습법으로, 인간 선호도에 맞는 결과를 도출한다. 이 모델은 DPO와 작은 매개변수, 최적 데이터셋 등을 활용하여 메타의 '라마•2-70b-챗'과 앤트로픽의 '클로드-V1' 등 더 큰 모델의 성능을 능가하는 것으로 나타났다.

Copyright © 2025. Codenary All Rights Reserved.