Event Analysis · Composed · Analysis Team v5.0.0 · Rev 0

적이 GPU 22만 장을 빌려준 날

머스크는 왜 Colossus 1 전량을 Anthropic 에 넘겼나. 그리고 R&D 자동화 가속은 RSI(재귀적 자기개선) 진입을 의미하는가.

AI 산업 / 인프라·전략 2026-05-06 2026-05-07 06:58:46
딜 구조 / 1

적이 GPU 22만 장을 빌려준 날

2026년 5월 6일, SpaceX 가 멤피스 Colossus 1 데이터센터의 컴퓨트 자원 전량을 Anthropic 에 임대한다고 발표했다. 불과 석 달 전 일론 머스크가 'Anthropic 은 서구 문명을 혐오한다' 며 공격하던 회사다.
계약 규모는 300MW 이상, Nvidia GPU 약 22만 장이다. Colossus 1 한 동 전체다. 2024년 가동 당시 세계 최대 단일 학습 클러스터로 불리던 시설이 통째로 경쟁사에 넘어갔다.

xAI 의 학습 컴퓨트는 같은 멤피스에 신축한 Colossus 2 로 이미 옮겨졌다. Colossus 2 는 2026년 1월 1GW(기가와트) 로 가동을 시작해 4월 1.5GW 를 목표로 증설 중이다. Colossus 1 보다 3배 이상 큰 규모다. 여기에 미시시피 사우스헤이븐의 신규 사이트 'MACROHARDRR' 까지 더하면 xAI 의 2026년 말 GPU 목표는 100만 장에 이른다.

요컨대 머스크는 적에게 GPU 를 넘기면서 자기 학습 능력은 오히려 더 키웠다. 양보가 아니라 자산 재배치다.
머스크는 적에게 GPU 를 넘기면서 자기 학습 능력은 오히려 더 키웠다.
트리거 / 2

머스크의 셈법

왜 적과 손잡았는가? 답은 한 줄짜리 적개심이 아니라 네 갈래 셈법에 있다.

첫째, Colossus 2 가 1GW 로 가동되면서 Colossus 1 은 xAI 입장에서 비싼 유휴 자산이 됐다. 월 단위 전력비만 수천만 달러가 드는 시설을 놀릴 수 없다. 임대 수익은 그 자체로 합리다.

둘째, SpaceX 와 xAI 가 합병한 뒤 SpaceX 의 재무 측면에서 외부 임대 수익이 필요했다. 데이터센터의 안정적 임차인 가운데 GW 급 수요를 가진 회사는 한 손에 꼽힌다.

셋째, 머스크는 OpenAI 와 법정 다툼 중이다. 5월 6일 'OpenAI 의 최대 경쟁자' 와 손잡는 모습은 그 자체로 메시지다. 4월 30일 머스크는 xAI 가 OpenAI 모델 증류(distillation, 큰 모델의 출력으로 작은 모델을 학습시키는 기법) 로 Grok 을 키웠다고 시인한 직후다.

넷째, Anthropic 은 6월 IPO(기업공개) 를 앞두고 컴퓨트 헤드라인이 필요했다. 양사 모두 발표 시점에 헤드라인 수요가 있었다. 4월 16일 Opus 4.7 의 SWE-Bench Verified 87.6% 라는 1위 탈환 직후, 5월 6일의 적과의 동침 발표는 IPO 로드쇼의 정확한 타이밍이다.
비대칭 / 3

양대 클라우드와 우주

Anthropic 의 컴퓨트 약정은 단순한 공급원 다변화가 아니다. AWS 와 Google 양쪽에서 각 5GW 를 동시에 확약받은 회사는 사상 초유다.

AWS 와는 2026년 4월 21일 확장 협약을 맺었다. Anthropic 이 향후 10년간 AWS 에 1,000억 달러 이상을 지출하고, Amazon 은 누적 최대 330억 달러를 출자한다. 이 약정 위에서 Anthropic 의 프리머니 가치는 3,500억 달러로 산정됐다. 1년 전 약 600억 달러 대비 약 5.8배다.

Google 과는 4월 24일 추가 400억 달러 규모 투자와 5GW TPU(텐서 처리 장치, Google 의 자체 AI 가속기) 확약이 보도됐다. 양대 클라우드의 핵심 가속기를 동시에 확보한 셈이다.

여기에 SpaceX 의 Colossus 1 0.3GW 가 더해졌고, 우주 데이터센터 GW 급 공동 검토까지 거론된다. 합산하면 약 10GW 가 넘는다. 이 정도 컴퓨트 권리를 한 회사가 동시에 쥔 사례는 없다. OpenAI 의 GW 급 약정이 Microsoft 와 Oracle 라인에 묶여 있는 점과 비교하면 비대칭이 뚜렷하다.
AWS 약정
5GW
10년 / $1,000억+ 지출
Amazon 누적 출자
최대 $330억
2026-04-21
Google TPU
5GW
$400억 추가 투자
SpaceX Colossus 1
0.3GW
GPU 약 22만 장
프리머니 가치
$3,500억
1년 전 대비 5.8배
Claude Code ARR
$25억
2026-02 기준
Anthropic 컴퓨트 약정 — 공급원별
AWS·Google 각 5GW + SpaceX 0.3GW. 합산 10GW + 우주 검토
출처: Anthropic·Bloomberg·CNBC / 2026-04~05
Takeaway 단일 AI 회사가 양대 클라우드에서 각 5GW 를 동시에 확약받은 사례는 처음이다.
자동화 / 4

70~90%, 그리고 18배

Anthropic 의 성능 곡선이 가파른 이유는 컴퓨트 하나로 설명되지 않는다. 핵심은 Claude 가 차세대 Claude 의 학습 코드를 70~90% 작성한다는 사실이다. 인간 엔지니어가 짜던 학습·실험·튜닝 코드의 거의 전부를 모델 자신이 쓴다.

내부 벤치마크 한 줄이 이 변화를 압축한다. CPU 전용 소형 LM(언어 모델) 학습 코드 최적화 라는 동일 과제에서, Opus 4 가 2025년 5월 평균 2.9배 가속을 달성했다. 같은 과제에서 2026년 4월 모델은 평균 52배를 달성했다. 11개월 동안 약 18배 빨라졌다.

세대당 컴퓨트 효율도 동일 품질 기준 3~4배 개선됐다고 Anthropic 은 보고한다. 이 두 흐름이 곱해지면, 같은 GPU 한 장이 1년 전 1장과는 다른 자원이 된다. 컴퓨트의 양적 확보 위에 질적 가속이 얹혀 있다.

외부 벤치마크상 결과는 5월 시점 SWE-Bench Verified(소프트웨어 엔지니어링 능력 표준 벤치마크) 로 확인된다. 4월 16일 공개된 Opus 4.7 이 87.6%, 미공개 제한 배포인 Mythos Preview 가 93.9% 를 기록했다. Claude Code 의 연환산 매출은 2월 기준 25억 달러로, 코딩 에이전트 자체가 흑자 사업으로 성장했다.
같은 GPU 한 장이 1년 전 1장과는 다른 자원이 된다.
Anthropic 내부 R&D 가속 벤치마크
동일 과제 'CPU 소형 LM 학습 코드 최적화' 평균 가속 배수 — 11개월 만에 약 18배 빨라짐
출처: Anthropic 내부 보고치 / 2026-05 (자체 발표 — 외부 검증 제한)
Takeaway 11개월 동안 약 18배. 가속 곡선이 꺾이지 않으면 RSI 정의 자체가 흐려진다.
임계점 / 5

이미 진입했는가, 임박한가

Anthropic 의 모델이 자기 후속 모델 코드의 70~90% 를 쓴다는 사실은, RSI(재귀적 자기개선) — 모델이 자신을 더 똑똑하게 만드는 코드를 스스로 쓰는 단계 — 의 약한 형태로 보일 만하다.

그러나 Anthropic 공동창업자 Jack Clark 본인의 추정치는 다르다. 그는 RSI 도래 확률을 2027년 말 30%, 2028년 말 60% 로 둔다. 이미 진입한 단계가 아니라 진입 임박 단계라는 입장이다.

이 차이는 정의 문제다. R&D 자동화는 인간 엔지니어링 노동의 자동화다. 모델이 인간이 시킨 학습 코드를 효율적으로 짠다. RSI 의 강한 정의는 모델이 자신의 아키텍처·목표·학습 방식 자체를 스스로 결정하고 개선하는 단계다. 둘 사이에는 모델이 무엇을 결정하는가 의 분기가 있다.

현 시점 Claude 는 인간이 정한 목표 — SWE-Bench 점수, 컴퓨트 효율, Constitutional AI(헌법적 AI, Anthropic 이 모델 행동을 200개 이상의 명시 원칙으로 제약하는 학습 기법) 의 안전 원칙 — 안에서 코드를 빠르게 쓴다. 자기 목표를 새로 정의하지는 않는다. R&D 가속이 18배여도, 가속의 방향은 여전히 인간이 지정한다.

단 Clark 의 60% 라는 숫자는 결코 작지 않다. 'RSI 가 2년 반 안에 절반 이상의 확률로 도래한다' 는 추정을, 그 회사 공동창업자가 공개적으로 말한다는 사실 자체가 신호다. 음모적 해석이 아니라 회사 본인의 자기 추정이다.
R&D 가속이 18배여도, 가속의 방향은 여전히 인간이 지정한다.
신호 / 6

분기점은 어디서 결정되는가

다음 12개월 안에 RSI 가설의 분기를 결정할 신호 세 가지가 있다.

첫째, Anthropic 의 R&D 가속 벤치마크가 52배에서 어디까지 가는가. 2026년 말 100배를 넘어서면 18개월 만에 약 35배 가속이다. 이 곡선이 꺾이지 않으면 Clark 의 30~60% 추정 자체가 위로 수정될 가능성이 있다.

둘째, Mythos 후속 모델이 어떤 형태로 공개되는가. 미공개 제한 배포로 묶여 있다는 사실 자체가, Anthropic 이 모델의 일부 기능을 아직 시장에 풀 단계가 아닌 것으로 판단했다는 신호다. 일반 공개로 전환되면 격차의 시장화 단계, 유지되면 격차의 내부화 단계다.

셋째, 머스크-Anthropic 임대가 단발성 거래로 끝나는가, 우주 데이터센터까지 확장되는가. 우주 GW 급 공동 검토가 실제 계약으로 진행되면 컴퓨트의 지상 한계를 넘어서는 단계로 진입한다.

이 셋이 모두 위쪽으로 풀리면 2027년 말은 빠르고, 셋 다 멈추면 RSI 논의는 다시 늦춰진다.
반대 관점 / 모순

봉합하지 않은 충돌

관점 A: Anthropic 의 R&D 자동화는 이미 RSI 의 약한 형태에 진입했다 — 모델이 후속 모델 코드의 70~90% 를 쓰고 11개월 만에 18배 가속이 나왔다.
관점 B: 공동창업자 Jack Clark 본인이 RSI 확률을 2028년 말 60% 로 둔다. 아직 진입 전이라는 회사 내부의 자기 진단이다.
근거 충돌: 전자는 18배 가속·자동화 비율을 근거로 한다. 후자는 '모델이 자기 목표·아키텍처를 스스로 결정하는가' 라는 강한 정의를 적용한다.
→ 현 시점 정의 문제로 후자(아직 진입 전)에 손을 들었다. 단 R&D 가속 곡선이 꺾이지 않으면 정의 자체가 흐려질 수 있다. 패배한 강한 진입 가설은 100배 벤치마크 돌파 시 부활한다.
관점 A: 머스크의 Colossus 1 임대는 적과의 동침 — 적개심을 누른 전략적 양보다.
관점 B: Colossus 2(1GW) 가동으로 Colossus 1 은 xAI 입장에서 비싼 유휴 자산이 됐고, xAI 의 학습 컴퓨트는 임대 후에도 3배 이상 커졌다. 자산 재배치다.
근거 충돌: xAI 2026년 말 GPU 목표 100만 장은 임대 후에도 유효하다. SpaceX-xAI 합병 후 외부 임대 수익 필요라는 재무 동인도 함께 작동했다.
→ 후자(자산 재배치)에 손을 들었다. 단 OpenAI 소송 진행과 Anthropic IPO 시점에 발표를 맞춘 타이밍은 메시지 효과를 의도했다. 두 동기가 동시에 작동한 거래다.
관점 A: Anthropic 의 컴퓨트 우위(약 10GW)가 OpenAI 와의 격차를 결정한다.
관점 B: 성능 우위의 핵심은 컴퓨트 양이 아니라 R&D 자동화·세대당 컴퓨트 효율 3~4배 개선이다. 같은 GPU 한 장의 생산성이 다르다.
근거 충돌: 동일 품질 대비 3~4배 적은 컴퓨트로 도달한다는 자체 보고치. 동시에 단일 회사가 양대 클라우드 5GW 씩을 쥔 사례 없음.
→ 후자 우세. 단 R&D 자동화 자체가 컴퓨트 양에 비례해 빨라지므로 둘은 곱셈 관계로 작동한다. 패배한 컴퓨트 우위 단독 가설은 효율 개선이 정체될 때 부활한다.
앞으로 무엇을 볼까

감시 신호

📈 Anthropic R&D 가속 벤치마크 100배 돌파
동일 과제(CPU 소형 LM 학습 최적화) 평균 가속이 52배에서 100배를 넘는가
→ RSI 임박 가설 vs 가속 정체 가설의 분기. 넘으면 Clark 의 30~60% 추정 위로 수정 가능
2026-12-31
🔬 Claude Mythos 후속 모델 공개 형태
미공개 제한 배포 유지인가 일반 공개로 전환인가
→ 내부 능력 격차의 시장화 단계 vs 내부화 단계 분기
2026-09
🛰️ SpaceX-Anthropic 우주 데이터센터 본계약
공동 검토 단계가 GW 급 본계약으로 발전하는가
→ 컴퓨트의 지상 한계 돌파 단계 진입 여부
2026-12
💹 Anthropic 6월 IPO 가격 결정
3,500억 달러 프리머니가 IPO 시점 어떻게 평가되는가
→ 시장의 컴퓨트 우위 인정 여부와 자본 조달 능력
2026-06-30
⏱️ Jack Clark RSI 추정치 갱신
공동창업자가 60%(2028 말) 숫자를 어느 방향으로 수정하는가
→ 내부 관측 기반 RSI 진입 임박도. 상향 수정은 가장 강한 단일 신호
신뢰도 (78%)
1차 출처(CNBC·Bloomberg·Anthropic 공식·datacenterdynamics·SemiAnalysis) 다양·신선도 높음. 단 Anthropic 내부 R&D 가속 수치(2.9배→52배)와 Claude 가 코드 70~90% 작성한다는 비율은 자체 보고치이므로 외부 검증은 제한적. RSI 확률 60% 는 Clark 본인의 자기 추정이라는 점에 주의.
분석가의 한계
5월 6일의 임대 발표는 단일 사건이지만, 그 안에는 컴퓨트 시장의 재편, R&D 자동화의 가속, 그리고 임박한 임계점에 대한 한 회사 공동창업자의 60% 라는 자기 추정이 같이 들어 있다. 헤드라인이 가린 것은 후자 쪽이다.