공유된 기사
"앤트로픽, 혁신적 AI 모델 '클로드 4' 시리즈 출시 - 코딩과 에이전트 기능에서 큰 도약"
앤트로픽이 새로운 인공지능 모델 '클로드 4' 시리즈를 출시하며 AI 기술의 새로운 장을 열었다. 이번에 공개된 '클로드 4 오퍼스'와 '클로드 4 소네트'는 특히 코딩과 도구 사용에 강점을 보이며, 복잡한 작업을 수행하는 데 있어 높은 자율성과 정확도를 자랑한다. 오퍼스 4는 장시간의 작업을 안정적으로 수행할 수 있도록 설계되어, 기존 모델보다 월등한 성능을 보여준다. 특히, 라쿠텐 그룹의 테스트에서 24시간 동안 포켓몬 게임을 플레이하면서도 7시간 동안 코딩 개선을 진행할 수 있었다고 한다.
오퍼스 4는 소프트웨어 엔지니어링 벤치마크 'SWE•벤치'에서 72.5%를 기록하며, 오픈AI의 'GPT-4.1'과 구글의 '제미나이 2.5 프로'를 능가하는 성과를 보였다. 그러나 모든 지표에서 1위를 차지하지는 못했으며, 멀티모달 평가나 과학 지식 문제에서는 오픈AI의 모델을 넘지 못했다. 대신, 도구 활용을 추론 과정에 직접 통합하여 정교한 답변을 생성하는 것이 강점으로 작용했다. 또한, 기억 유지 기능이 향상되어 장기 프로젝트에서 맥락을 잃지 않고 지속적인 성능을 제공한다.
앤트로픽은 코딩 작업에 특화된 새로운 AI 도구 '클로드 코드'도 정식 출시했다. 이 도구는 IDE와 통합되어 VS 코드, 젯브레인, 깃허브용 확장 기능을 제공하며, 깃허브 커넥터를 통해 코드 리뷰 피드백에 자동 응답하거나 오류를 수정할 수 있다. API는 아마존 '베드록'과 구글 '버텍스 AI'를 통해 제공되며, 오퍼스 4는 유료 사용자에게만 제공된다.
오퍼스 4는 소프트웨어 엔지니어링 벤치마크 'SWE•벤치'에서 72.5%를 기록하며, 오픈AI의 'GPT-4.1'과 구글의 '제미나이 2.5 프로'를 능가하는 성과를 보였다. 그러나 모든 지표에서 1위를 차지하지는 못했으며, 멀티모달 평가나 과학 지식 문제에서는 오픈AI의 모델을 넘지 못했다. 대신, 도구 활용을 추론 과정에 직접 통합하여 정교한 답변을 생성하는 것이 강점으로 작용했다. 또한, 기억 유지 기능이 향상되어 장기 프로젝트에서 맥락을 잃지 않고 지속적인 성능을 제공한다.
앤트로픽은 코딩 작업에 특화된 새로운 AI 도구 '클로드 코드'도 정식 출시했다. 이 도구는 IDE와 통합되어 VS 코드, 젯브레인, 깃허브용 확장 기능을 제공하며, 깃허브 커넥터를 통해 코드 리뷰 피드백에 자동 응답하거나 오류를 수정할 수 있다. API는 아마존 '베드록'과 구글 '버텍스 AI'를 통해 제공되며, 오퍼스 4는 유료 사용자에게만 제공된다.