logo
공유된 기사
"구글, AI 경쟁에서 주도권 잡기 위해 '멀티모달' 전략 도입... 차세대 LLM '제미니' 공개 임박"
미국 구글이 캘리포니아주 마운틴뷰에 위치한 찰스턴이스트 캠퍼스에서 인공지능(AI) 개발을 총괄하고 있다. 이 곳에서 구글은 '멀티모달(Multi Modal)'이라는 텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 AI 기술을 개발하고 있다. 이를 통해 오픈AI의 챗GPT를 뛰어넘을 비밀 병기를 개발하기 위한 작업을 진행 중이다.

구글은 지난 5월 발표한 LLM 팜2를 통해 약 3조6000억 개의 토큰으로 훈련한 것으로 알려졌다. 이는 지난해 출시된 팜이 7800억 개 토큰으로 학습한 것에 비해 훨씬 많은 양이다. 또한, 구글은 다음달에 공개할 차세대 LLM '제미니'를 통해 멀티모달 AI 기술 부문에서 경쟁우위에 서겠다는 전략을 가지고 있다.

제미니는 GPT•4보다 연산량 기준으로 다섯 배 이상 많은 양의 학습을 하는 것으로 알려졌다. 이를 통해 AI가 모든 분야, 산업, 비즈니스에 영향을 미치고, 우리가 생활하고 일하는 방식도 크게 변화할 것이라는 구글의 비전을 보여준다. 하지만, 아직 비디오 프레임 인식과 구현 등의 기술적 과제와 막대한 에너지 소모, 투자비용 등의 문제가 남아있다.

Copyright © 2025. Codenary All Rights Reserved.