Recent Posts
Recent Comments
Link
06-21 11:04
«   2026/06   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Archives
Today
Total
관리 메뉴

꿈 많은 사람의 이야기

앤트로픽 Claude Fable 5와 Mythos 5, 왜 출시 사흘 만에 차단됐을까 본문

인공지능(AI)/AI 일반

앤트로픽 Claude Fable 5와 Mythos 5, 왜 출시 사흘 만에 차단됐을까

이수진의 블로그 2026. 6. 20. 18:40
반응형

포스팅 개요

이번 포스팅은 2026년 6월에 일어난 Claude Fable 5와 Mythos 5 차단 사건을 정리하는 글입니다. 앤트로픽(Anthropic)이 보안에 특화된 모델 두 개를 6월 9일에 공개했고, 사흘 뒤인 6월 12일에 미국 상무부의 지시로 두 모델이 전 세계에서 막혔습니다. 출시한 회사가 안전을 이유로 잠가 뒀던 모델에 안전장치를 달아 일반에 풀었는데, 사흘 만에 정부가 안보를 이유로 다시 잠근 셈입니다.

단순한 출시 해프닝으로 끝날 일이 아닙니다. 강력한 AI 모델이 처음으로 미국 수출 통제의 대상이 됐고, 그 명단에는 KISA, SK텔레콤, 삼성전자, SK하이닉스 같은 한국 기관과 기업의 이름이 올라 있었기 때문입니다. 이 글은 그 사흘 동안 정확히 무슨 일이 있었는지, 그리고 6월 20일 글을 정리하는 현재까지 이어지는 일주일을 같이 정리합니다.

 

참고한 주요 출처는 아래와 같습니다.

 


포스팅 본문

포스팅 개요에서 짧게 언급했듯, 앤트로픽(Anthropic)이 6월 9일에 보안 특화 모델 Fable 5(대중 공개)와 Mythos 5(파트너에 공개)를 공개했고, 미국 상무부가 6월 12일에 두 모델을 막았습니다. 사이가 사흘이었습니다. 이번 본문에서는 그 사흘 사이에 어떤 일이 있었는지부터 시작해서, 두 모델이 어떤 모델인지, 앤트로픽이 처음에 왜 폐쇄적으로 공개했는지, 차단의 표면적 사유 뒤에 어떤 이야기가 있었는지, 그리고 같은 주에 한국에서는 어떤 일이 벌어졌는지를 순서대로 살펴보겠습니다.

[1]. 짧게 정리하는 시간 순서

먼저 시간 순서를 짧게 정리해 보겠습니다. 6월 9일, 앤트로픽이 보안 특화 모델 두 개를 한꺼번에 공개했습니다. 하나는 누구나 쓸 수 있는 Fable 5, 다른 하나는 검증된 파트너에게만 열린 Mythos 5입니다. 그동안 폐쇄형으로만 다뤘던 미토스(Mythos) 계열의 능력이 처음으로 일반 사용자에게도 열린 셈이었습니다.

6월 12일 금요일 저녁, 미국 상무부 장관 하워드 러트닉이 앤트로픽 CEO 다리오 아모데이에게 서한을 보냈습니다. Fable 5와 Mythos 5를 수출 통제 대상으로 지정하고, 미국 밖은 물론 미국 안에 있는 외국 국적자에게도 두 모델을 제공하지 말라는 내용이었습니다. 보도에 따르면 통보가 도착하고 두 모델을 비활성화하기까지 앤트로픽에 주어진 시간은 약 90분이었다고 합니다. 사용자의 국적을 그 짧은 시간에 가려낼 방법이 없었던 회사는, 국적을 일일이 따지는 대신 두 모델 자체를 전 세계에서 막았습니다. Opus 4.8과 Sonnet, Haiku 같은 다른 모델은 그대로 두었습니다.

 

새 모델이 공개됐다가 정부 명령으로 닫히는 데 걸린 시간이 사흘인데요. 6월 20일 현재까지 두 모델은 다시 열리지 않고 있습니다. 앤트로픽과 상무부는 거의 매일 협의를 이어 가고 있다고 합니다.


[2]. Fable 5와 Mythos 5는 어떤 모델인가

클로드(Claude)나 앤트로픽은 익숙하셔도 Fable, Mythos에 대해서 익숙하지 않으실 독자 분들이 있을 수 있기에, 간단하게 두 모델이 무엇인지 보겠습니다. 미토스(Mythos) 계열은 평소 우리가 쓰는 Claude에서 제공해주는 계열의 모델 Opus, Sonnet 등과 용도가 다릅니다. 이 모델은 소프트웨어의 보안 취약점을 찾아내는 데 특화된 모델인데요. 시작은 2026년 4월 7일 공개된 미토스 프리뷰(내부 코드명 Capybara)였고, 이번에 나온 Fable 5와 Mythos 5가 그 후속작입니다.

 

클로드의 미토스가 일반 보안 점검 도구와 다른 점은, 취약점을 찾는 데서 멈추지 않는다는 점입니다. 그 취약점을 실제로 파고드는 공격 코드까지 직접 만들어 냅니다. 앤트로픽의 자체 검증에 따르면 미토스 프리뷰는 파이어폭스 자바스크립트 엔진을 대상으로 250번 시도해 동작하는 익스플로잇 181개를 만들었습니다. 같은 시험에서 직전 세대 모델인 Opus 4.6은 수백 번을 시도하고도 두 개만 만들었다고 합니다. 성능차이가 나는 것이죠. 또 OpenBSD에 27년 동안 묻혀 있던 TCP SACK 정수 오버플로 결함, FFmpeg H.264 코덱에 16년 동안 남아 있던 결함을 찾아냈는데, 특히 FFmpeg 쪽은 자동 분석 도구가 500만 번을 훑고도 놓쳤던 결함이었습니다.

 

이번 출시에서 가장 눈에 띄는 점은, 같은 모델을 두 갈래로 나눠 내놓았다는 것입니다. Fable 5와 Mythos 5는 기반 모델이 같고, 안전장치가 있느냐 없느냐만 다릅니다.

  • Mythos 5 (claude-mythos-5): 안전장치(분류기)를 떼어낸 버전입니다. 공격을 할 수 있는 능력을 그대로 쓸 수 있고, 미국 정부와 파트너에게만 제공됩니다.
  • Fable 5 (claude-fable-5): 같은 능력을 일반에 풀어도 되도록 안전장치를 더한 버전입니다. 누구나 쓸 수 있습니다. 대중에 푼 모델이죠.

Fable 5의 안전장치 설계는 꽤 흥미로운데요. 모델의 성능을 전반적으로 낮추는 방식이 아니라, 위험한 요청만 골라 다른 모델로 넘기는 방식입니다. 사이버 공격, 생물·화학, 모델 복제(증류)처럼 악용 위험이 큰 요청이 들어오면, 그 요청은 Fable 5가 아니라 범용 안전 모델인 Opus 4.8이 대신 처리하도록 하는 것이죠. 이때 API는 stop_reason: "refusal" 값을 돌려주고, 과금도 Fable 5가 아닌 Opus 4.8 기준으로 매겨집니다(입력 토큰은 캐시 읽기 단가로 할인됩니다). 

 

가격과 제공 방식을 표로 정리하면 다음과 같습니다.

 

구분 Fable 5 Mythos 5 Opus 4.8 (참고)
공개 범위 누구나 사용 Glasswing 파트너·미국 정부 한정 누구나 사용
안전장치 위험 요청은 Opus 4.8로 우회 분류기 제거 범용 안전장치
가격(입력/출력, 100만 토큰) $10 / $50 $10 / $50 $5 / $25
주요 용도 일반 코딩·보안 방어 고난도 취약점 분석·공격 코드 생성 범용
6월 20일 현재(작성일 기준) 차단 차단 정상

[3]. Project Glasswing — 강한 모델을 누구에게 먼저 줄 것인가

앤트로픽이 미토스를 처음부터 일반에 풀지 않은 이유가 있는데요. 모델이 가진 강력한 공격 능력이 방어자보다 공격자 손에 먼저 들어가는 상황을 피하려고 한 것입니다. 회사는 이렇게 설명했습니다.

"By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important systems before models with similar capabilities become broadly available."

(이 모델을 먼저 핵심 산업 파트너와 오픈소스 개발자들에게 제한적으로 공개함으로써, 비슷한 능력의 모델이 널리 풀리기 전에 방어자들이 가장 중요한 시스템부터 보호하도록 하려는 것이다.)

 

쉽게 말해 방어하는 쪽에 먼저 쓰게 하자는 것입니다. 비슷한 수준의 모델은 언젠가 누구나 손에 넣게 될 텐데, 그전에 가장 중요한 시스템부터 미리 단단하게 만들어 두자는 생각이죠. 이 구상을 실제 프로그램으로 옮긴 것이 Project Glasswing입니다.

참여 기관의 면면이 꽤 화려합니다. AWS·애플·구글·마이크로소프트·엔비디아 같은 빅테크에, 크라우드스트라이크·팔로알토네트웍스 같은 보안 기업, 그리고 JP모건과 리눅스 재단까지 11개 기관이 창립 멤버로 이름을 올렸습니다. 앤트로픽은 1억 달러어치 모델 사용 크레딧과 함께, 오픈소스 보안에 400만 달러(OpenSSF·Alpha-Omega 250만, 아파치 재단 150만)를 지원했습니다.

 

결과 자체도 꽤나 흥미로운데요! 5월 26일자 자체 보고를 보면, 초기 파트너 약 50곳이 한 달 남짓 만에 고위험·심각 취약점 1만여 건을 찾아냈고, 그중 독립 검증을 거친 1,752건 가운데 90.6%가 진짜 취약점으로 확인됐습니다. wolfSSL의 인증서 위조 결함(CVE-2026-5194)이 대표 사례로 공개됐습니다. 6월 2일 프로그램은 15개국 150여 개 기관으로 확대됐고, 6월 19일 시점에는 약 200곳까지 다시 늘었습니다. KISA와 SK텔레콤, 삼성전자와 SK하이닉스가 이름을 올린 것도 이 무렵 즈음인 것 같습니다(정확하지 않을 수 있습니다).

 

미토스의 능력이 알려지자 업계도 술렁였습니다. 모델이 정식 발표되기도 전에 사이버보안 종목 주가가 일제히 떨어지기도 했죠(내 주식 ㅠ ). AI가 취약점 발굴을 대신해 주면, 그 일을 팔아 온 보안 회사의 입지가 좁아진다는 걱정 때문이었죠. 재미있는 건, 크게 떨어진 종목 중 하나인 크라우드스트라이크가 정작 미토스를 가장 먼저 쓸 수 있는 Glasswing 창립 파트너였다는 점입니다.


[4]. 왜 차단되었을까? 그리고 앤트로픽의 입장

이렇게 이슈가 됐던 모델이 대중에 공개되었고, 일반 공개 사흘 만에 차단됐습니다. 발단은 6월 11일 밤이었습니다. 아마존 CEO 앤디 재시가 백악관과 다른 안건으로 통화를 하던 도중, Fable 5에서 발견된 탈옥(여러 프롬프트로 안전장치를 우회해, 사이버 공격에 쓰일 수 있는 정보를 끌어내는 기법) 가능성을 거론했습니다. 백악관은 재무장관 스콧 베센트에게 즉시 보고하라고 권했고, 다음 날인 12일 행정명령으로 이어졌습니다. 다만 같은 시점에 아마존은 앤트로픽에 약 130억 달러를 투자한 최대 투자자였고, 자사 Bedrock에서 Fable 5를 판매하고 있었습니다. 한쪽에서는 모델을 팔고 있었고, 다른 한쪽에서는 그 모델의 위험을 정부에 알린 셈이죠.

러트닉 장관은 "중국, 러시아 등 우려국의 군사·정보 사용자에게 모델이 도달할 위험"을 사유로 들었습니다. 앤트로픽에서 일하는 외국 국적 직원도 제공 금지 대상이었고, 어기면 민·형사 처벌을 받을 수 있다는 경고가 따라붙었습니다.

 

앤트로픽은 이번 조치가 과하다는 입장입니다. 회사는 공식 입장문에서 이렇게 반박했습니다.

 

"We disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people."

(좁은 우회 가능성 하나가 발견됐다고 해서, 이미 수억 명에게 배포된 상용 모델을 회수해야 한다는 데에는 동의할 수 없다.)

 

우회 방법 하나 때문에 수억 명이 쓰는 상용 모델 전체를 회수하는 건 지나치다는 이야기죠. 회사는 접근을 되살리려고 정부와 협의를 이어 가고 있습니다. 6월 15일에는 앤트로픽 기술진이 상무부에서 실무 협의를 진행했고, 국가사이버국장 션 케언크로스도 자리에 함께했다고 알려지고 있습니다. 협상의 전면에는 공동창업자 톰 브라운과 공공정책 책임자 사라 헥이 나섰고, 6월 18일에는 앤트로픽이 러트닉 장관에게 차단 해제 제안서를 보냈다고 알려져있죠. 


[5]. 이 사건을 어떻게 읽을 것인가

개인적으로 이번 일에서 가장 눈여겨볼 점은, 경쟁의 핵심 질문이 바뀌었다는 것입니다. 지금까지 AI 경쟁의 질문은 "누가 더 강한 모델을 만드느냐"였습니다. 그런데 이번엔 정부가 직접 "그 모델을 누가 써도 되느냐"를 정했습니다. 반도체에 적용되던 미국식 수출 통제가 이제 프런티어 AI 모델로 옮겨 왔습니다. 같은 모델이라도 쓰는 사람의 국적과 위치에 따라 접근이 막힐 수 있다는 것은, 몇 달 전만 해도 상상하기 어려웠던 일입니다.

 

그래서 이번 사건이 국내에서 다시 끌어올린 화두가 "소버린 AI"입니다. 핵심은 어떤 모델이 멈추느냐가 아니라, 그 모델을 멈출 수 있는 스위치가 어디에 있느냐는 질문이죠. 행정과 국방, 사법, 의료처럼 멈추면 안 되는 시스템을 특정 벤더의 폐쇄 모델 위에 올려 두면, 그 스위치는 결국 워싱턴(이번 사건의 경우)에 놓이게 됩니다. 이번 사건은 그동안 가설로만 다뤄지던 그 그림을 한 번에 가시화했다고 생각합니다. 경각심을 깨우쳤다고 생각합니다. 락인이 회계장부에 적히는 비용의 문제가 아니라 안보의 문제일 수 있다는 시각이, 같은 이유에서 다시 부각되고 있습니다.

 

소버린 AI라는 단어가 나오면 "결국 ~처럼 갈라파고스가 되는 길 아니냐"는 냉소의 관점도 어김없이 따라붙곤 합니다. 하지만 그럼에도 좋은 외부 모델은 더 적극적으로 끌어다 쓰되, 그 위에 우리 손에 잡힌 자체 역량을 같이 깔아야 하지않을까 생각이 듭니다. 자체 기술을 들고 남의 기술을 쓰는 것과, 가진 것 하나 없이 남의 기술을 빌려 쓰는 것은 다른 관점이니까요. 

 

특히 우리나라는 생각보다 가지고 있는 카드가 있다고 생각합니다. 메모리, 파운드리, 국내의 유수한 AI 기업들(업스테이지, 네이버, LG 등)이 가지고 있는 AI 기술력들 그리고 클라우드까지 한 나라 안에서 닿는 풀스택은 글로벌에서도 흔치 않은 조합이라고 생각합니다. 

어쩌면, 우리나라도 이런 준비를 해야하지 않을까 라는 개인적인 생각입니다.


마무리

긴 글 읽어 주셔서 감사합니다. 혹시라도 내용이 틀렸거나, 의견이 있으시거나 한다면 편하게 댓글 등 달아주세요.

관심 있는 분들에게 도움이 되었으면 합니다.

반응형
Comments