logo
공유된 기사
"구글, 차세대 언어모델 '제미나이 디퓨전' 공개 - 속도와 정확성의 혁신적 도약"
구글이 차세대 언어모델 '제미나이 디퓨전(Gemini Diffusion)'을 공개하며, 텍스트 생성 기술의 새로운 장을 열었다. 이 모델은 이미지 생성 기술에서 사용되던 '확산(diffusion)' 방식을 언어모델에 접목하여, 기존 트랜스포머 아키텍처의 한계를 극복하고 생성 속도와 일관성을 크게 향상시킬 수 있는 대안으로 주목받고 있다. 구글 딥마인드는 이 모델을 통해 텍스트 생성의 속도와 정확성을 동시에 해결하려는 의지를 밝혔다.

제미나이 디퓨전은 기존의 자기회귀(autoregressive) 방식과 달리, 무작위 노이즈에서 시작해 점진적으로 의미 있는 문장으로 정제하는 과정을 따른다. 이를 통해 블록 단위 텍스트를 병렬로 처리할 수 있어 생성 속도가 획기적으로 빨라지며, 초당 1000~2000개의 토큰을 생성할 수 있다. 또한, '자기 정제(Self•correction)' 구조를 통해 생성 중 발생하는 오류를 수정하고 결과의 일관성과 정확성을 높이는 강점을 지닌다.

디퓨전 모델은 순방향과 역방향 디퓨전이라는 두 가지 과정으로 학습되며, 다양한 노이즈 조건에서 문장을 재구성하는 능력을 갖추게 된다. 구글은 제미나이 디퓨전의 성능이 '제미나이 2.0 플래시•라이트'와 비슷하거나 일부 영역에서는 앞선다고 평가하며, 특히 코딩이나 수학 영역에서 더 유리하다고 전했다. 딥마인드는 향후 제미나이 디퓨전을 본격 확장할 계획이며, 현재 랩스 프로그램을 통해 실험 버전을 제공하고 있다.
Copyright © 2025. Codenary All Rights Reserved.