Event Analysis · Composed · Analysis Team v5.0.0 · Rev 0

막힌 곳은 GPU 다이가 아니라 그 다음이다

AI 호황의 진짜 병목은 패키징(CoWoS)과 메모리(HBM)에 있다. 2026년 5월 현재 셋이 동시에 매진이고, 균형은 2027년 중반 이후로 미뤄졌다.

산업·테크놀로지 2026-05-09 2026-05-09 11:47:33
1 / 공급망 해부

공급망 4겹과 약한 고리

AI 칩이 부족하다고 한다. 정확히는 GPU 다이가 부족한 것이 아니다. 그 뒤의 두 단계 — 첨단 패키징과 고대역폭 메모리 — 가 동시에 막혀 있다.
AI 칩 공급망은 네 겹이다. 첫째는 팹리스 설계 (엔비디아·AMD·애플·퀄컴 등 칩 도면을 그리는 회사). 둘째는 파운드리 다이 생산 (TSMC 가 사실상 독점, 삼성이 추격). 셋째는 첨단 패키징 — 다이를 쌓고 잇는 공정으로, TSMC 의 CoWoS (Chip on Wafer on Substrate, 인터포저 위에 다이와 메모리를 같이 올리는 기술) 가 대표 격이다. 넷째는 HBM (High Bandwidth Memory, 고대역폭 메모리 — D램을 12단까지 수직으로 쌓아 만든 칩) 적층으로, SK하이닉스·삼성·마이크론 셋이 만든다.

병목은 늘 가장 약한 고리에서 터진다. 2023년에는 GPU 다이 자체가 모자랐다. 2024~2025년에는 CoWoS 가 막혔다. 2026년 현재는 CoWoS 와 TSMC 의 N2 (2나노 노드) 와 HBM4 가 동시에 매진이다. 단일 병목이 아니라 셋이 겹쳐 있다는 점이 이번 사이클의 특징이다.

사실은 이렇다. 다이는 점점 빨리 늘리지만, 패키징과 메모리가 같은 속도로 따라오지 못한다. 다이를 더 찍어내도 쌓을 곳이 없고, 곁에 붙일 메모리가 없다. 호황의 한가운데에서 출하가 막히는 이유다.
TSMC CoWoS 월 capacity
75K → 125K wafer
2025 → 2026년 말 목표
TSMC N2 capacity
월 50K → 100K wafer
2026년 전량 예약
삼성 HBM 월 wafer 투입
170K → 250K
현재 → 2026년 말, +47%
AI 서버 캐비닛 수요
2.8만 → 6만대+
2025 → 2026 (모건스탠리)
다이는 빨리 늘리지만, 패키징과 메모리가 같은 속도로 따라오지 못한다.
공급망 4겹의 병목 강도 (2026-05)
다이 자체는 풀렸다 — 막힌 곳은 패키징과 메모리
출처: SemiAnalysis · TrendForce · 2026-05
Takeaway 2026년 병목은 단일 지점이 아니라 셋이 겹친 복합 병목이다.
2 / 패키징

CoWoS — 8배 늘렸는데도 모자란다

왜 패키징에서 막히는가. 한 줄로 답하면, AI 가속기는 한 다이가 아니라 다이 묶음이기 때문이다. 엔비디아 Blackwell 한 패키지 안에 GPU 다이 두 개와 HBM 스택 여덟 개가 들어간다. 이걸 한 인터포저 위에 정렬해 붙이는 공정이 CoWoS 다. 다이 하나 만드는 것보다 시간이 더 걸리는데도 사람들은 처음 한동안 이 단계를 무시했다.

TSMC 는 CoWoS 월 capacity 를 2023년 1만 5천 wafer 에서 2026년 말 12만~13만 wafer 로 8배 늘리고 있다 (출처: TSMC, SemiAnalysis). 사상 최대 패키징 capex 사이클이다. 그런데도 부족하다. 왜? 수요가 가용량의 약 3배라는 것이 SemiAnalysis 의 추정이다. capacity 곡선은 가파른데 수요 곡선이 더 가파르다.

단 변곡점은 보인다. 2026년 4분기에 capacity 가 12만 wafer 를 넘으면 그때 처음으로 capacity 곡선이 수요 곡선의 상승 속도 를 따라잡는다. 절대량이 따라잡는 것은 그 다음 단계 — 빨라야 2027년 중반이다.
TSMC CoWoS 월 capacity 추이 (단위: wafer)
8배 확장에도 수요는 가용량의 3배
출처: TSMC · SemiAnalysis · 2026-05
Takeaway capacity 는 8배 늘었지만, 수요는 그보다 빨리 늘었다.
3 / 메모리

HBM — 협상력이 칩사로 넘어갔다

이전 사이클에선 메모리 회사가 GPU 회사에 부탁하는 입장이었다. 지금은 반대다. SK하이닉스가 HBM 시장 62% 를 쥐고 있고 (2026년 기준), 마이크론이 삼성을 처음 추월해 2위에 올랐다 (출처: astutegroup.com). HBM3E 12단도 매진이고, HBM4 도 양산 시작과 동시에 매진이다.

이 점은 단순한 부족 이상의 의미가 있다. Porter 의 5세력 (5 Forces, 산업 경쟁 구조 분석 틀) 중 공급자 협상력 항목이 메모리 쪽으로 기울었다는 뜻이다. 2026년 HBM·DRAM 가격이 10대 후반에서 20% 오를 거라는 전망 (TrendForce) 은 그 결과다. 엔비디아·AMD 가 메모리 대 GPU 마진 비율을 협상하던 시대가 끝났다.

단 이 균형도 영구적이지 않다. 삼성이 HBM 월 wafer 투입을 17만에서 25만으로 47% 늘리는 사상 최대 capex 를 진행 중이다 (출처: TrendForce). 마이크론도 HBM4 샘플 단계에 들어갔다. 2027년 중후반에는 3사 균형이 다시 잡힐 가능성이 있다. 그러나 그때까지는 SK하이닉스 가격표가 사실상 시장 가격이다.
이번 사이클에선 메모리 회사가 가격표를 들고, GPU 회사가 부탁하는 자리로 옮겨 앉았다.
HBM 시장 점유율 (2026)
마이크론이 사상 처음 삼성을 추월 — 한국 2사 과점이 깨지는 첫 신호
출처: Astutegroup · 2026 estimate
Takeaway 한국 2사 과점에서 3사 균형으로 — 협상 구도가 바뀌고 있다.
4 / 경쟁 구도

엔비디아 Rubin 지연과 AMD 분산

엔비디아는 Rubin 으로 갈아타려 하고 있다. 그러나 갈아타는 길이 좁다. JP모건 추정에 따르면 2026년 Blackwell 출하는 약 180만 개로 떨어지고, Rubin 은 공급 제약 시 20~30만 개에 그칠 전망이다 (출처: tweaktown · theregister.com). HBM4 인증, ConnectX-9 NIC, 액냉 요건이 동시에 발목을 잡는다. 결과적으로 2026년 고급 GPU 시장의 70% 는 여전히 Blackwell 차지가 될 것으로 보인다 (TrendForce).

AMD 는 이 틈에 들어왔다. MI400 시리즈가 HBM4 432GB 를 탑재하고 공개됐고, 메타가 약 600억 달러 규모의 장기 계약을 맺었다는 보도가 나왔다. 핵심은 분산 이다. 엔비디아의 Rubin 지연이 길어질수록, 하이퍼스케일러는 단일 공급자 의존을 줄일 동기가 커진다.

단 한 가지는 짚어야 한다. AMD MI400 의 경쟁력은 HBM4 432GB 라는 메모리 용량 에서 나온다. 즉 AMD 의 분산 효과조차 같은 메모리 병목 위에 서 있다. HBM 이 풀려야 AMD 의 분산도 풀린다. 메모리가 제약이면 GPU 회사가 둘이든 셋이든 총 출하량은 늘지 않는다. 분산은 점유율 이동일 뿐, 절대량 해법이 아니다.
엔비디아 GPU 출하 추정 (단위: 만 개)
Rubin 양산 지연으로 2026년 출하 절반 가까이 증발
출처: JP모건 · TweakTown · TrendForce · 2026-04
Takeaway 낙관 시나리오와 제약 시나리오의 격차가 20배가 넘는다 — 메모리 인증이 변수의 거의 전부다.
5 / 엣지 사이클

엣지로 흘러내리는 추론 — NPU 사이드

데이터센터 GPU 가 부족하면 추론 워크로드는 어디로 가는가. 일부는 단말로 밀려난다. AI PC 와 스마트폰의 NPU (Neural Processing Unit, 신경망 전용 가속기 — 행렬 연산을 저전력으로 처리하는 별도 블록) 가 사이드 사이클을 만들고 있는 이유다.

마이크로소프트가 Copilot+ PC 요건으로 40 TOPS (Tera Operations Per Second, 초당 1조회 연산) 를 못박은 뒤, 칩 회사들은 그 위로 경쟁한다. 퀄컴 X2 가 85, AMD XDNA 가 60, 인텔 루나레이크가 48, 애플 M4 가 38 TOPS 다. AI PC 누적 보급은 2027년까지 1억 대를 넘을 것으로 전망되고, 엣지 AI 하드웨어 시장은 2026년 307억 달러에서 2031년 687억 달러로 두 배가 넘게 성장할 것으로 본다 (Mordor Intelligence).

핵심은 이 흐름이 데이터센터 부족의 결과 이자 완충 이라는 점이다. 결과인 이유는 분명하다. GPU 가 모자라니 모델을 작게 만들어 단말에 올리려는 압력이 커졌다. 완충인 이유는 모든 추론을 클라우드에 보낼 필요가 없어졌다는 것이다. 단 이 완충은 학습에는 도움이 안 된다. 학습은 여전히 데이터센터 GPU 의 영역이고, 거기는 풀리지 않는다.
AI PC NPU TOPS 비교
Copilot+ 기준선 40 TOPS 위로 경쟁 — 퀄컴이 두 배 이상
출처: Newegg Insider · CES 2026
Takeaway 기준선은 40 TOPS, 그러나 실제 경쟁은 60~85 TOPS 구간에서 벌어진다.
6 / 시나리오

시나리오 — 균형은 언제 오는가

공급-수요 균형 시점에 대해 시장은 셋으로 갈린다.

첫째, 기준선 — 2027년 중반 균형. TSMC CoWoS 가 12만 wafer 를 넘고, 삼성 HBM 25만 wafer 가 가동되며, 마이크론 HBM4 가 양산에 진입한다. Rubin Ultra 와 MI450 이 정상 양산되면 capacity 가 수요를 따라잡는다. 확률 가장 높음. 영향: HBM 가격 안정, 엔비디아 마진 회복.

둘째, 강세 — 2027년 말~2028년으로 미뤄짐. AI 추론 수요가 학습 수요보다 빨리 커져 capacity 확장을 앞지른다. 메타·구글·OpenAI 의 추론 비용이 학습 비용을 추월하는 전환점이 트리거. 확률 중간. 영향: 메모리社 협상력 1년 더 유지, AMD 점유율 25% 돌파.

셋째, 약세 — 2026년 말 조기 균형. 거시 둔화로 하이퍼스케일러 capex 가 주춤하면 수요 곡선이 내려와 capacity 와 만난다. 트리거는 2026년 하반기 미국 경기 둔화 + 광고·클라우드 매출 둔화 동시 발생. 확률 낮음. 영향: HBM 가격 하락, 메모리 회사 capex 후회.

넷째, 와일드카드 — 양자/광컴퓨팅 또는 알고리즘 효율화 (DeepSeek 류) 가 GPU 수요 자체를 깎는 경로. 확률 매우 낮으나 영향 매우 큼. 2027년 이전엔 무게 두지 않아도 되지만, 시그널은 보고 있어야 한다.
시나리오 4종 — 확률 × 영향
기준선이 가장 무거우나, 강세 시나리오의 영향이 더 크다
출처: 본 분석 · 2026-05
Takeaway 확률 가중 평균은 2027년 중후반에 모인다.
7 / 반대 가설

모순과 반대 가설

이 분석은 두 개의 큰 모순 위에 서 있다. 봉합하지 않고 그대로 둔다.

첫째, 메모리社 협상력의 지속성. 한쪽 입장은 SK하이닉스의 62% 점유와 HBM4 매진이 적어도 2027년까지 가격 협상권을 메모리에 둔다고 본다. 반대 입장은 삼성이 47% capex 를 동시에 진행하고 마이크론이 HBM4 샘플 단계에 진입한 사실을 들어, capacity 가 들어오는 순간 가격은 빠르게 무너진다고 본다. HBM 은 본질적으로 D램이고, D램 사이클은 늘 capacity 가 따라잡는 순간 폭락했다는 역사적 패턴이 그쪽 근거다. 현재 손은 메모리社 입장에 들어준다 — 단 그 패배 입장은 2026년 4분기 이후 마이크론·삼성 capacity 가 인증을 통과하는 순간 살아난다.

둘째, NPU 의 보완 효과. 한쪽은 AI PC NPU 가 데이터센터 GPU 부족을 의미 있게 흡수한다고 본다. 반대 입장은 학습과 대규모 추론은 NPU 로 옮길 수 없는 워크로드라며, NPU 시장 성장과 데이터센터 부족은 별개의 사이클이라고 본다. 이쪽은 후자 손을 든다 — NPU 는 GPU 부족을 대체 하는 게 아니라 별도 시장 을 만든다. 단 추론 비용이 학습 비용을 넘어서는 시점이 오면, 단말 추론으로의 이전 압력이 실제 데이터센터 수요를 줄일 수 있다. 그때는 전자 입장이 살아난다.
모순을 봉합하지 않는다 — 패배한 입장이 살아나는 조건을 먼저 본다.
8 / 감시 신호

감시 신호 — 무엇을 보고 분기를 판단하나

앞으로 12~18개월 동안 다음 다섯 신호가 시나리오 분기를 결정한다. 발생 시점과 방향이 분석 갱신의 트리거가 된다.
반대 관점 / 모순

봉합하지 않은 충돌

관점 A: HBM 협상력은 적어도 2027년까지 메모리社에 머문다 — 매진 + 62% 과점 + HBM4 인증 격차
관점 B: 삼성 47% capex 와 마이크론 HBM4 진입이 capacity 곡선을 빠르게 들어올린다. D램은 늘 capacity 가 따라잡는 순간 무너졌다
근거 충돌: SK하이닉스 62% (Astutegroup) · 삼성 17만→25만 wafer (TrendForce) · D램 사이클 역사적 패턴
→ 현재 시점은 A 손. 단 2026년 4분기 이후 삼성·마이크론 HBM4 인증 통과가 가시화되면 B 입장이 살아난다 — 패배 가설로 보존.
관점 A: AI PC NPU 사이클이 데이터센터 GPU 부족을 일정 부분 흡수한다
관점 B: 학습과 대규모 추론은 NPU 로 옮길 수 없다. NPU 시장 성장과 데이터센터 부족은 별개 사이클이다
근거 충돌: 퀄컴 X2 85 TOPS · 데이터센터 학습은 H100/B200 급 행렬 연산 필수 · 모델 크기 비교
→ B 손. NPU 는 GPU 부족을 대체 하는 게 아니라 병렬 시장 이다. 단 추론 비용이 학습 비용을 추월하는 시점이 오면 단말 이전 압력이 실수요를 줄여 A 가 살아남는다.
관점 A: AMD MI400 의 약 600억 달러 메타 계약은 엔비디아 의존 분산의 본격화다
관점 B: AMD 의 경쟁력은 HBM4 432GB 라는 메모리 용량에 의존한다. 메모리가 제약이면 분산은 점유율 이동일 뿐 총량 해법이 아니다
근거 충돌: MI400 사양 · 메타 계약 보도 · HBM 매진 상태
→ B 손. 시장 구조 차원에서 분산은 일어나고 있으나, 총 출하량 부족 해소는 HBM capacity 가 풀려야 가능하다. A 입장은 HBM 풀린 이후 시점에 비로소 의미를 갖는다.
앞으로 무엇을 볼까

감시 신호

📦 TSMC CoWoS 월 12만 wafer 도달
2026년 4분기 capacity 목표치 달성 여부 — 분기별 TSMC IR 발언과 SemiAnalysis 추적이 1차 지표.
→ 기준선 vs 강세 시나리오 분기 (capacity 곡선 변곡점)
2026-12-31
🔬 HBM4 엔비디아 인증 완료
Rubin 양산의 마지막 게이트. SK하이닉스 → 삼성 → 마이크론 순으로 인증 통과 시점이 발표됨.
→ Rubin 출하 25만 (제약) vs 570만 (낙관) 시나리오 분기
2026-Q4
🏭 메타-AMD MI400 대량 출하 시작
약 600억 달러 계약의 실제 출하 개시 시점. 하이퍼스케일러 멀티 벤더 전략의 첫 검증.
→ 엔비디아 점유율 80%대 유지 vs AMD 25% 돌파 분기
2026-Q3
💾 마이크론 HBM4 양산 진입
현재 샘플 단계. 양산 진입 발표가 HBM 가격 협상력 이전의 1차 신호.
→ 메모리社 협상력 지속 vs 가격 하락 분기
2027-H1
📈 하이퍼스케일러 추론 capex 비중 50% 돌파
메타·구글·MS 분기 발표에서 추론 인프라 지출이 학습 지출을 초과하는 시점.
→ 강세 시나리오 (수요 영구 부족) 의 핵심 트리거
2026~2027
💻 AI PC 누적 출하 1억 대
엣지 추론 사이클의 임계 질량. NPU 생태계 락인 여부 결정.
→ 엣지 보완 시나리오의 활성화 신호
2027-12
신뢰도 (78%)
1차 출처 13개 (SemiAnalysis, TrendForce, JP모건, 모건스탠리, TSMC, SK하이닉스 공식, theregister, tweaktown 등). capacity·점유율·출하량 수치는 출처 명시 가능, 시나리오 확률은 본 분석 자체 추정. 2026년 4분기 이후 갱신 필요.
분석가의 한계
AI 칩 부족이라고 한 마디로 요약하면 본질을 놓친다. 막힌 곳은 다이가 아니라 그 다음 두 단계다. 그리고 그 두 단계는 capex 가 결과를 만들기까지 18~24개월이 걸린다. 균형은 오지만, 천천히 온다.