
앤트로픽 새 AI ‘오퍼스4.7’ 공개…사이버 위협 능력 의도적 축소
AI 모델 ‘클로드 미토스(Claude Mythos)’의 보안 위험성으로 전 세계적 우려를 자아낸 앤트로픽이 새 모델에서 사이버 위협 능력을 의도적으로 제한하는 실험에 나섰다.
앤트로픽은 16일(현지시간) 현재 일반에 공개된 최상위 모델인 ‘클로드 오퍼스 4.6’의 개선판 ‘오퍼스 4.7(Opus 4.7)’을 출시했다. 이 모델은 코딩과 금융분석 등 주요 영역에서 성능이 대폭 강화됐다. 코딩 능력을 평가하는 ‘SWE-벤치 프로’와 ‘SWE-벤치 베리파이드’ 성능지표(벤치마크)에서 각각 64.3%와 87.6%를 기록해 현재 공개된 AI 모델 가운데 최고 수준을 드러냈다. 금융 분석 능력을 측정하는 ‘파이낸스 에이전트 v1.1’ 지표에서도 64.4%를 기록하며 전작과 주요 경쟁 모델을 웃돌았다.

다만 미토스 프리뷰와 비교하면 거의 모든 지표에서 낮은 성능을 보였다. 앤트로픽도 “가장 강력한 모델인 클로드 미토스 미리보기에 비해 기능이 다소 제한적”이라고 공식 인정했다.
핵심은 사이버 보안 기능의 의도적 축소다. 앤트로픽은 훈련 과정에서 오퍼스 4.7의 사이버 보안 관련 기능만을 선별적으로 줄이는 실험을 진행했다고 밝혔다. 동시에 해킹 등 금지되거나 위험성이 높은 사이버 보안 관련 요청을 자동으로 탐지·차단하는 안전장치도 적용했다. 다만 앤트로픽의 ‘사이버 검증 프로그램’에 참여하는 보안 전문가에 한해서는 취약점 연구 등 정당한 목적으로 해당 모델을 사용할 수 있도록 허용했다.
앤트로픽은 이번 출시를 ‘시험’으로 규정하면서 “미토스급 모델을 일반에 출시한다는 궁극적인 목표를 달성하는 데 도움이 될 것”이라고 강조했다.
앞서 앤트로픽은 지난 7일 미토스 모델이 전문가 수준의 사이버 보안 취약점 탐지 능력을 갖추고 있다며 이른바 ‘프로젝트 글래스윙(Project Glasswing)’을 발표, 일반 공개 대신 주요 기술·금융 기업에 선제 제공하겠다고 밝혔다. 이를 계기로 미국 연방준비제도(Fed)와 재무부, 영란은행, 캐나다은행 등 각국 금융당국이 잇달아 긴급회의를 열고 관련 사이버 위협 대응 방안을 논의했다.
미 행정부와의 갈등도 이번 출시의 배경으로 작용하고 있다. 앤트로픽을 ‘공급망 위험’ 기업으로 지정하며 사실상 사용 제재에 나선 미 국방부와 달리, 재무부는 블룸버그 통신 보도에 따르면 미토스 접속 권한 확보를 위해 앤트로픽과 협의에 나선 것으로 알려졌다. 앤트로픽은 “정부는 AI 모델과 관련한 국가 안보 위협을 평가하고 완화해야 한다”며 “지방·주(州)·연방 정부와 협력할 준비가 돼 있다”고 밝혔다.