Event Analysis · Composed · Analysis Team v5.5.4 · Rev 0

AI 보조금 시대가 닫히는 일주일

MS 의 Claude Code 라이선스 취소와 Uber 의 예산 4개월 소진은 같은 신호다. '단가는 매년 반토막' 전제 위에 세워진 엔터프라이즈 워크플로가 흔들린다.

기술/산업 (AI 인프라 · 엔터프라이즈 SaaS) 2026-05-25 2026-05-25 23:36:12
산업 변곡 / 1

사건 — 한 주에 겹친 세 신호

2026년 5월, 세 가지 신호가 같은 주에 겹쳤다. 마이크로소프트가 사내 Claude Code 라이선스를 일괄 취소했고, Uber 의 최고기술책임자는 연간 AI 예산이 4개월 만에 바닥났다고 사내에 알렸다. GitHub 은 Copilot 의 정액제 (flat-rate) 요금제를 단계적으로 폐지하고 사용량 기반 과금 (UBP, Usage-Based Pricing) 으로 옮기겠다고 공지했다.
세 사건은 표면적으로는 다른 회사들의 별개 결정이다. 그러나 그 밑바닥에는 한 가지 같은 회계가 깔려 있다. 지난 2년간 엔터프라이즈가 AI 도구의 단가를 0 에 수렴하는 변수로 가정해왔다는 사실, 그리고 그 가정이 이번 분기를 기점으로 더는 유지될 수 없다는 점이다.

사실은 단순하다. 미국 AI 소프트웨어의 effective per-token price (실제 호출 비용) 는 최근 6개월 사이 20에서 37 퍼센트 올랐다. 정액제 표 (rate card) 의 숫자는 거의 그대로지만, rate limit (호출 제한) 이 좁아지고 premium request 한도가 축소되면서 같은 워크플로를 돌리는 비용은 사실상 그만큼 올라간 셈이다.

단 마이크로소프트의 결정이 상징적이다. 마이크로소프트는 OpenAI 에 130억 달러를 누적 투자했고 (출처: 사용자 제공 정리 / Azure 컴퓨트 독점 공급 조건), 동시에 Anthropic 의 컴퓨트 상당 부분을 Azure 가 호스트한다. 자기 인프라 위에 올라간 도구의 토큰 비용을 본사가 못 견딘다는 사실은, 가격이 이제 더 내려갈 수 없다는 것을 자기 검증한 것에 가깝다.
MS 의 OpenAI 누적 투자
≈ 130억 달러
2023-01 추가분 포함
6개월 effective price 인상
20 ~ 37 %
Claude · GPT · Gemini
Uber 의 2026 예산 소진
4 개월
12개월치 ÷ 3 배 burn
MS Claude Code 라이선스 취소
2026-05
사내 전면
자기 인프라 위에 올라간 경쟁사 도구의 토큰 비용을 본사가 못 견딘다.
구조 / 2

왜 단가는 더 내려가지 않는가

AI 토큰의 단가는 다른 소프트웨어 단가와 다르게 움직인다. 일반 SaaS 는 한 번 만들면 한 명을 더 받아도 추가 비용이 거의 들지 않는다. 그러나 LLM 추론은 한 번 호출할 때마다 GPU 시간을 소모하고, 그 GPU 는 H100 과 B200 같은 특정 가속기로만 돌아간다. 가속기의 공급은 엔비디아와 그 공급망의 생산 능력에 묶여 있고, 가동 비용은 전력 단가가 결정한다.

2023년부터 2024년까지의 단가 인하는 두 가지 힘에서 나왔다. 하나는 모델 효율 개선 (양자화·distillation 같은 압축 기법) 이고, 다른 하나는 랩 (lab — 모델을 만드는 회사들) 이 IPO 직전 단계에 매출 ramp 을 보여주기 위해 단가를 일부 손실 흡수한 보조금이다. 효율 개선은 앞으로도 계속되지만 폭이 줄고 있다. 보조금은 시점의 문제였다.

랩의 처지에서 보면 dilemma 가 명확하다. 가격을 그대로 두면 매출 ramp 은 유지되지만 단위 경제성 (호출 한 건당 마진) 이 깨진다. 가격을 올리면 단위 경제성은 회복되지만 사용량이 줄어 매출 ramp 의 가속도가 떨어진다. 둘 다 IPO 밸류에이션의 전제를 약화시킨다.

사실은 두 길 사이의 타협이 진행 중이다. 표 위의 가격은 그대로 두되 rate limit 을 좁히고 premium request 한도를 줄여서 effective price 만 올린다. 사용자는 같은 워크플로를 돌리려면 더 비싼 티어 (tier) 로 올라가거나 호출 빈도를 줄여야 한다. 둘 다 매출은 증가시키지만, 후자가 누적되면 결국 ramp 둔화로 돌아온다.
6개월 effective per-token price 변화
rate card 는 거의 그대로, rate limit·premium 한도 축소가 사실상 인상
출처: 사용자 제공 정리 + API 가격표 변경 이력 / 2025-Q4 ~ 2026-Q2 / 2025-10=100 정규화
Takeaway Claude 가 인상폭의 상단. 가장 빠른 매출 ramp 압력을 받는 랩일수록 폭이 크다.
사례 / 3

엔터프라이즈 예산이 깨지는 방식 — Uber 의 4개월

Uber 의 사내 메모는 한 줄로 요약된다. 2026 회계연도 AI 예산을 4개월 만에 다 썼다. 이는 burn rate 가 가정 대비 세 배라는 뜻이다. 예산이 무너진 원인은 한 가지가 아니다. 단가 인상이 한 축, 자율 에이전트 도입으로 한 작업당 호출 빈도가 늘어난 것이 다른 축, 그리고 rate limit 강화로 같은 결과를 얻기 위해 retry (재호출) 가 늘어난 것이 또 하나의 축이다.

이 세 축은 서로를 증폭한다. 단가가 오르고, 호출이 더 많아지고, 실패한 호출을 다시 부른다. 단가 인상폭 자체는 20 퍼센트대지만 같은 워크플로의 실제 비용은 두세 배로 부푼다. Uber 만의 사정이 아닐 가능성이 크다 — '연간 AI 예산을 분기 안에 다 쓴다' 는 신호는 코드 어시스턴트와 자율 에이전트를 적극적으로 깐 다른 대형 기업에서도 동시 다발적으로 들려올 것으로 보인다.

예산을 두 배로 늘리는 단순 대응은 통하지 않는다. 회계연도 중간에 IT 예산을 두 배로 늘리려면 다른 비용을 줄여야 하고, 그러기엔 AI 가 아직 그만큼 명확한 ROI (return on investment, 투자 대비 수익) 를 보여준 단계가 아니다. 결국 사용량을 줄이거나, 더 싼 모델로 다운그레이드하거나, 자율 에이전트의 자율도를 깎는 쪽으로 압력이 간다.
Uber 의 burn rate 가 3배가 된 분해
단가 인상 단독이 아니다 — 빈도·retry 증가가 함께 곱해진다
출처: 사용자 제공 메모 + 외부 단가 변화 종합 / 추정 분해 / 계획 100 정규화
Takeaway 단가만으로는 +60. 빈도·retry 의 누적이 본체. 단가 인하만으로는 예산을 못 살린다.
세부 비중은 사내 메모의 총합 3배 burn 사실에서 역산한 분석적 분해. 절대 비중은 회사마다 다를 수 있다.
행위자 / 4

MS 의 이중적 위치 — 호스트이자 이탈 고객

이번 결정에서 가장 해석이 갈리는 행위자는 마이크로소프트다. 마이크로소프트는 세 자리에 동시에 앉아 있다. 첫 자리는 OpenAI 의 최대 자본 투자자 (약 130억 달러) 다. 두 자리는 Anthropic 의 컴퓨트를 상당 부분 공급하는 Azure 호스트다. 세 번째 자리는 사내 개발자 수만 명이 Claude Code 와 Copilot 을 동시에 쓰던 엔터프라이즈 고객이다.

이번 주 마이크로소프트가 한 일은 세 번째 자리에서 일어났다. Claude Code 라이선스를 끊고 사내 단일 코드 어시스턴트를 GitHub Copilot 으로 모은다. 표면적인 이유는 토큰당 과금 부담이지만, 그 결정의 신호 가치는 더 크다. 마이크로소프트는 두 번째 자리 (Azure 가 Anthropic 을 호스트한다) 에서 Anthropic 의 단가 구조를 거의 정확히 안다. 그 단가를 본사가 못 견딘다는 신호는 외부 엔터프라이즈에는 사실상 '우리도 이걸 견디지 못한다' 는 인증이다.

동시에 두 번째 자리는 그대로 남는다. Anthropic 이 Azure 컴퓨트를 계속 산다면 마이크로소프트의 클라우드 매출은 줄지 않는다. 첫 번째 자리도 강화된다 — OpenAI 모델로 단일화된 사내 워크플로는 OpenAI 매출에 직접 기여한다. 세 자리를 한꺼번에 보면, 마이크로소프트는 자기 자본 (OpenAI 지분) 과 자기 인프라 (Azure 매출) 를 키우면서 가장 강한 경쟁 도구 하나를 잘라낸 셈이다.

단 마이크로소프트의 결정은 곧 산업 표준 신호로 읽힌다. 산업의 두 번째 후발 (Anthropic) 이 첫 번째 후발 (OpenAI) 의 인프라 위에서 가격 경쟁을 한다는 구조 자체가 비대칭이다. 호스트가 고객 자격을 포기하면 다른 엔터프라이즈들도 같은 도구의 지속가능성을 의심하기 시작한다.
인과 / 5

보조금 → 진실 단가, 그리고 IPO 밸류에이션

AI 랩들의 IPO 밸류에이션 (200조에서 500조 원 범위) 은 한 가지 곡선을 전제한다. 매출은 가속 ramp 으로 늘고, 단위 경제성은 효율 개선으로 따라잡는다는 두 곡선의 교차다. 둘 다 보조금 단계의 연장이 가능했기 때문에 성립한다.

이번 변곡은 두 곡선을 동시에 흔든다. 랩이 가격을 유지·인하하면 단위 경제성이 늦게 따라잡혀 IPO 시점의 마진 곡선이 약해진다. 가격을 올리면 엔터프라이즈가 사용을 줄여 매출 ramp 의 기울기가 꺾인다. 매출 곡선과 마진 곡선 중 한쪽은 반드시 양보해야 하는 구조다.

사실은 둘을 동시에 양보하는 신호가 이미 나오고 있다. 단가 인상 (20에서 37 퍼센트) 으로 마진을 일부 회복하면서, 그 부담을 견디는 엔터프라이즈만 남기는 자연 선별이 진행 중이다. Uber 같은 대형 고객은 사용을 줄이지 않을 수 없고, 줄이면 ramp 가 꺾인다. 마이크로소프트의 Claude Code 컷은 같은 메커니즘의 가장 가시적인 사례다.

그러나 가속기 (H100·B200) 의 단가가 6개월 안에 의미 있게 떨어지지 않는다면, 효율 개선이 추가 단가 인하를 흡수할 여지도 좁다. 즉 이번 인상은 일회성 정상화가 아니라 단가 곡선의 기저 (floor) 가 다시 그려지는 일에 가깝다.
AI 단가 곡선의 네 단계
보조금 → 인하 경쟁 → 조용한 인상 → UBP 표준화
출처: 사용자 제공 타임라인 + 가격표 변경 이력 종합
Takeaway 보조금 시기 1.5년 + 인하 1.5년 + 인상 1년. UBP 표준화 시기는 진행 중.
시나리오 / 6

네 갈래 — 향후 12개월의 시나리오

각 시나리오는 단가 곡선 (랩이 단가를 어떻게 다루는가) 과 수요 탄력성 (엔터프라이즈가 사용을 얼마나 줄이는가) 두 축의 조합이다. 확률은 사용자 시점 (2026-05-25) 기준 향후 12개월 가중치다.

첫 시나리오 — '점진 정상화' 는 기준선이다. 랩들이 추가 인상 없이 현재 수준 (effective +20~37 퍼센트) 을 유지하고, 엔터프라이즈는 자율 에이전트의 자율도를 깎으며 적응한다. ramp 둔화는 일어나지만 완만하다. IPO 시점이 6개월에서 12개월 미뤄지는 정도.

둘째 — '급격한 정상화' 는 더 큰 인상 (effective +50 퍼센트 이상) 이 한 번 더 오는 경우다. 가속기 공급이 좁아지거나 전력 단가가 추가로 오르면 가능하다. Uber 같은 사용 축소 신호가 분기마다 들리고 ramp 가 명확히 꺾인다. 랩 밸류에이션의 가장 큰 위험 시나리오다.

셋째 — '효율 혁신 재인하' 는 압축·distillation·mixture-of-experts 같은 기법으로 단가가 다시 한 단계 내려가는 경로다. 가능하지만 폭이 줄어들고 있고, 6개월 안에 산업 평균 effective price 를 의미 있게 끌어내릴 정도의 혁신은 신호가 약하다.

넷째 — '엔터프라이즈 자체 모델 회귀' 는 대형 고객이 자기 인프라에서 오픈소스 모델 (Llama 계열·Qwen 계열) 을 돌려 비용을 깎는 경로다. 이미 일부 진행되고 있고, 마이크로소프트의 결정이 이 흐름을 가속할 가능성이 있다. 단 운영 부담이 커서 모두가 갈 길은 아니다.
12개월 시나리오 — 확률 × 영향
x = 확률, y = 랩 밸류에이션에 미치는 영향 (음수=하방). 크기는 산업 전체 충격
출처: 본 보고서 자체 시나리오 설계 / 확률 가중치는 2026-05-25 시점
Takeaway 기준선이 가장 큼직하지만, 급격한 정상화가 영향·확률 곱에서 가장 위협적.
분배 / 7

행위자별 손익 — 누가 단기에 이기고 누가 지는가

단가 정상화의 손익은 행위자마다 다르게 떨어진다. 마이크로소프트는 두 자리 (자본·인프라) 가 강해지고 한 자리 (고객 비용) 가 정리됐다. OpenAI 는 사내 단일화 신호로 매출 면에서 단기 이득. 반대편 끝에 있는 행위자는 Anthropic 이다. 가장 상징적인 엔터프라이즈 고객을 잃었고, IPO 직전 단계의 매출 ramp 신호가 약해졌다.

엔터프라이즈 군에서는 보조금 단계에 자율 에이전트와 멀티-홉 워크플로를 적극 깐 회사 (Uber 같은) 가 가장 먼저 충격을 받는다. 반대로 AI 도입을 한 단계 늦췄던 회사들은 지금 비용 곡선이 명확해지는 단계에서 들어와 더 단단한 ROI 가정으로 설계할 수 있다. 시점을 늦춘 보수성이 비용 면에선 보상받는 국면이다.

GPU 공급망 — 엔비디아와 그 공급망 — 은 이 dilemma 의 외부에 있다. 누가 가격을 올리든 GPU 시간은 팔린다. 다만 랩들의 매출 ramp 이 꺾이면 차세대 가속기 발주 곡선이 함께 둔화될 가능성이 있어, 시차를 두고 영향이 닿는다.
쟁점

보조금 종료냐 정상화냐

이번 인상은 보조금 시기의 비정상적으로 낮은 단가가 진실 단가로 환원되는 일회성 정상화이며, 효율 혁신이 다시 단가를 끌어내릴 것이다. 그러나 이번 인상은 GPU·전력 단가의 하방 경직성과 IPO 직전 랩들의 매출 압력이 만나는 구조적 변곡이며, 단가 곡선의 기저 자체가 다시 그려지는 일이다. 정상화 측은 2023~2024 의 단가 인하 폭 (50~80%) 을, 구조 변곡 측은 가속기 공급·전력 단가의 6개월 추세와 마이크로소프트의 자기 인프라 위에서의 거부 신호를 든다. 단기 6에서 12개월은 구조 변곡 쪽에 무게가 실린다 — 가속기 단가의 의미 있는 하락이 보이지 않고, 마이크로소프트가 호스트로서 단가 구조를 알면서도 거부한 신호가 너무 강하다. 단 압축·distillation 의 큰 혁신이 한 번 더 터지거나, 차세대 가속기 (B200 후속) 의 공급 압력이 완화되면 정상화 측 입장이 18개월 시점부터 살아난다.

마이크로소프트의 결정은 토큰 비용 절감의 합리적 IT 결정이며, OpenAI 와의 자본 관계에서 자연스럽게 따라온 단일화에 가깝다. 그러나 마이크로소프트는 Azure 호스트로서 Anthropic 의 단가 구조를 거의 정확히 알며, 그 입장에서의 거부는 외부 엔터프라이즈에 사실상의 인증으로 작동하는 의도된 신호다. 단순 결정 측은 사내 도구 통합·관리 비용·라이선스 협상의 평범한 IT 결정 사례들을, 의도된 신호 측은 시점 (가격 인상이 가시화된 직후) 과 동시에 GitHub UBP 전환이 진행된 정황을 든다. 의도된 신호 쪽에 더 무게가 간다 — 시점이 너무 정확하고 두 결정 (Claude Code 컷·Copilot UBP 전환) 의 동기화가 우연이라 보기 어렵다. 단 마이크로소프트가 단일 사내 메모만으로 신호를 깊게 의도했다는 증거는 외부에서 검증되지 않은 상태이며, 사용자 인용 메모의 원문이 공개되면 단순 결정 측이 부분적으로 살아날 여지가 있다.

본 분석의 가정이 다음 6개 지점에서 시험된다. 한 곳이라도 반대 방향으로 움직이면 결론은 다시 작성되어야 한다.

2026-08
📊 Anthropic 2026 Q2 매출 성장률

MS 이탈 + 단가 인상 이후 첫 ramp 신호. 가속/둔화 분기점

기준선 vs 급격한 정상화 시나리오 분기
2026-09
🧾 GitHub Copilot UBP 전환 완료 시점

Business / Enterprise flat-rate 의 잔여 한도 폐지 일정

MS 산하 SaaS 의 가격 모델이 산업 표준으로 자리잡는 속도
2026-08
🏢 두 번째 메가 엔터프라이즈의 사용 축소 공지

Salesforce·Adobe·Meta·아마존 등에서 Uber 와 유사한 burn 신호 — 사내 메모·실적 컨퍼런스 발언

Uber 사례가 일회성인가, 산업 패턴인가
2026-11
🔌 H100 / B200 의 클라우드 시간당 단가

AWS p5·Azure ND·GCP A3 인스턴스의 hourly rate 변화. 6개월 안에 의미 있게 떨어지는가

효율 혁신 재인하 시나리오의 가능성 척도
2026-12
💰 Anthropic IPO 일정 / 밸류에이션 레인지

공식 S-1 또는 secondary 라운드의 implied valuation

단가 곡선 흔들림이 자본시장 가치에 얼마나 반영되는가
2027-02
🛠 오픈소스 모델 (Llama·Qwen) 의 엔터프라이즈 채택 발표

Fortune 500 중 자체 인프라 회귀를 공식화하는 사례 누적

엔터프라이즈 자체 모델 회귀 시나리오의 가속
신뢰도 (68%)
사용자 제공 정리가 1차 출처 — MS 사내 메모와 Uber 사내 메모는 원문 미공개이며 수치 (130억·20~37%·4개월) 는 인용 기반. 단가 곡선 구조와 시나리오 설계는 공개된 가격표 변경 이력·자본 라운드 사실에 기반.
분석가의 한계
2026년 5월의 한 주는 그 자체로 작은 사건들이지만, AI 단가 곡선의 기저가 다시 그려지는 시점의 가장 가시적인 신호로 남을 가능성이 있다. 다음 분기의 매출 ramp 발표와 추가 인상 여부가 이 변곡의 크기를 확정할 것이다.