NEWS

🌟 “챗GPT 뛰어넘었다?” 코딩까지 씹어먹은 새로운 AI 모델의 정체

everything-one-643 2025. 11. 25. 09:50

 

AI 경쟁이 다시 한 번 요동치고 있습니다. 이번 주인공은 바로 앤트로픽(Anthropic).
클로드(Claude)로 유명한 이 회사가 새로 내놓은 ‘클로드 오퍼스 4.5(Opus 4.5)’가 코딩과 에이전트 성능에서 현존 최고 수준을 찍었다는 소식인데요.
과연 어떤 모델이길래 업계가 들썩이고 있을까요? 오늘은 이 기술을 쉽게 풀어서 정리해드립니다.


🚀 클로드 오퍼스 4.5, 코딩 테스트에서 세계 1위

앤트로픽이 공개한 오퍼스 4.5는 SWE 벤치마크(소프트웨어 공학 테스트)에서 80.9%라는 최고 기록을 달성했습니다.

비교해 보면

  • GPT-5.1 코덱스 맥스: 77.9%
  • 구글 제미나이 3 프로: 76.2%

즉, 지금까지 코딩 성능 1위였던 모델들을 모두 제친 것.
“챗GPT보다 코딩 잘한다”는 말, 과장이 아니죠.


🤖 “학습한 적 없는 문제도 스스로 해결합니다”

특히 눈길을 끄는 건 ARC-AGI-2 테스트 성능입니다.
이 테스트는 ‘학습 데이터에 없던 새로운 문제를 얼마나 잘 풀 수 있는가’를 평가하는데요.

결과는…

  • 오퍼스 4.5: 37.6%
  • 제미나이 3 프로: 31.1%
  • GPT-5.1: 17.6%

이건 단순한 성능 차이가 아니라 추론 능력 자체의 격차라고 볼 수 있습니다.
앤트로픽이 왜 “새로운 지능 단계”라고 주장하는지 이해되는 부분입니다.


☁️ 어디서 사용할 수 있을까?

오퍼스 4.5는 다음에서 바로 이용 가능합니다.

  • 클로드 앱
  • 클로드 API
  • AWS
  • 마이크로소프트 애저
  • 구글 클라우드

사실상 모든 메이저 클라우드에서 바로 쓸 수 있다는 점도 큰 장점!


💸 가격도 3분의 1로 ‘확’ 낮췄다

앤트로픽은 출시와 함께 가격까지 크게 내려버렸습니다.

API 요금: 100만 토큰 기준

  • 이전: 입력 15달러 / 출력 75달러
  • 지금: 입력 5달러 / 출력 25달러

무려 3분의 1 수준.
성능은 올라가고, 가격은 내려가고… AI 시장 흔들기 시작한 겁니다.


🔍 한 줄 요약

앤트로픽의 클로드 오퍼스 4.5는

  • 코딩 테스트 세계 1위
  • 추론 능력에서도 경쟁사 압도
  • 주요 클라우드 전부 지원
  • 가격까지 대폭 인하

AI 경쟁의 중심이 다시 한 번 흔들릴 만한 강력한 업데이트입니다.
앞으로 실사용 사례가 나오면 더 큰 지각 변동이 오지 않을까 기대되네요.