젠슨 황과 마이클 델이 라스베이거스에서 추론의 무게중심 이동을 공식화했다. 메모리·전력이 구조적 병목으로 떠올랐다.
추론의 사내·엣지 회귀는 보안·지연·비용의 구조적 동력에 기반한 영구 추세 반면 퍼블릭 클라우드의 자체 NPU 와 가격 인하가 손익분기를 흔들면 회귀는 과도기적 현상에 그친다 Dell의 -87% 2년 비용 절감 추정은 현재 클라우드 토큰 단가를 기준으로 한 것. 클라우드 사업자가 12~18개월 안에 토큰 단가를 절반으로 깎으면 손익분기 3개월 가설은 흔들린다. 현 시점에서는 보안·지연 두 축이 비용보다 우선 — 즉 사내 회귀의 손을 들어준다. 그러나 클라우드 사업자의 자체 NPU 칩이 2027년 안에 추론 단가를 30% 이상 추가 인하하면 반대 입장이 되살아난다.
메모리 슈퍼사이클은 2027년 너머까지 지속된다 반면 SK하이닉스 +405%는 정점 신호이며 2026년 하반기에 가격 조정이 온다 HBM capa 전환이 구조적이라는 점은 side_a를 뒷받침. 그러나 메모리는 통상 가격 신호가 capa 증설을 자극해 24~30개월 후 공급이 회복되는 산업이다 — 이번에도 그 사이클이 반복될 가능성이 있다. 기준선은 side_a — 2027년 중반까지 부족 지속. 단 AMD·NVIDIA의 차세대 칩에 HBM4E가 적기 양산되지 않거나, 중국발 수요가 제재로 꺾이면 side_b의 단기 조정 시나리오가 트리거된다.
본 분석의 가정이 다음 5개 지점에서 시험된다. 한 곳이라도 반대 방향으로 움직이면 결론은 다시 작성되어야 한다.
Counterpoint 전망 (+50%) 대비 실제 인상폭이 얼마나 들어맞는지
메모리 슈퍼사이클 지속 vs 단기 조정 분기엔터프라이즈 데이터센터 서버 출하의 위쪽 꺾임 신호
사내·엣지 회귀가 마케팅인지 실제 추세인지Trainium·Maia 인스턴스의 토큰 단가 변동폭
클라우드 사업자 반격 시나리오 트리거차세대 HBM의 적기 공급 여부
공급 회복 속도 — 거품 조정 시나리오 분기1.43억 대 / 시장 55% 전망의 실제 달성치
엣지 추론 일반화 가속 여부