Event Analysis · Composed · Analysis Team v4.5.7 · Rev 0

3중 재설계 — DB 한 벌에서 AI 데이터 평면으로

Lift & Shift 시대는 끝났다. 2026년 8월 EU AI Act 시행이 기업 IT 현대화의 마감일을 정한다.

기술/인프라 — 엔터프라이즈 데이터 플랫폼 현대화 2026-05-03 2026-05-03 20:45:54

격차 진단 / 1

출발점 — DB 한 벌의 한계

일반 기업이 가진 IT 스택을 그려보면 그림이 단순하다. OLTP(트랜잭션 처리) RDBMS 한 벌, 그 위의 모놀리식 백엔드, React나 Vue로 만든 프론트, 야간에 도는 BI 배치 한 줄. 이 구조는 트랜잭션 처리에는 충분하다. 그러나 AI를 얹는 순간 받쳐주는 다리가 하나도 없다.

LLM(대형 언어 모델)이나 RAG(검색 증강 생성 — 외부 문서를 끌어와 답을 만드는 방식)를 운영 단계에서 돌리려면 비정형 데이터 적재, 임베딩 저장과 검색, 모델 추적, 데이터 계보 추적이 모두 필요하다. 기존 RDBMS 한 벌로는 어느 하나도 못 한다. 그래서 2024~2025년 LLM이 운영으로 들어오며 흐름이 바뀌었다. '클라우드로 일단 옮기자'는 Lift & Shift 시대가 닫혔다.

출발점의 또 다른 신호는 예산 구성이다. 전환 전 일반 기업은 IT 예산의 70~80%를 레거시 유지에 쓰고, 혁신 투자에는 20~30%만 남긴다. 이 비율이 AI 투자 여력의 천장이다. 즉 전환 압력은 기술 호기심이 아니라, 예산이 잠겨있다는 사실에서 온다.

핵심은 출발점 차이가 향후 12~24개월의 일정과 비용을 거의 결정한다는 점이다. 같은 산업 안에서도 디스커버리에 충실한 조직과 그렇지 않은 조직의 비용이 평균 2~3배 갈린다. 어디서 시작했는지가 어디까지 갈 수 있는지를 정한다.

유지 vs 혁신 예산

70~80% : 20~30%

전환 전 일반 기업 평균

현대화 후 인프라 비용 절감

25~35%

2022~2025 완료 기업 평균

3년 누적 ROI

200~304%

회수 기간 6~18개월 / 성공 사례 평균

릴리스 사이클 단축

40~60%

컨테이너 + CI/CD + Feature Store 결합치

전환 압력은 기술 호기심이 아니라, 예산이 잠겨있다는 사실에서 온다.

메커니즘 / 2

왜 세 레이어를 동시에 갈아야 하는가

현대화 청사진은 세 레이어로 갈린다. 데이터(레이크하우스 + 벡터DB), 컴퓨트(GPU + MLOps), 거버넌스(카탈로그 + 관측성). 핵심은 셋이 동시 재설계여야 한다는 점이다.

왜 동시인가. 데이터 레이어만 갈면 모델을 운영할 컴퓨트가 없다. 컴퓨트만 갈면 학습 데이터 평면이 흔들린다. 두 레이어를 다 깔아도 거버넌스가 비면 EU AI Act 시행 시점에 운영 일부를 멈춰야 한다. 한 레이어만 먼저 갈면 그 레이어가 다른 두 레이어의 부재를 메우기 위해 변형되고, 결국 셋 다 다시 짠다.

구체적으로 데이터 레이어는 객체 스토리지(S3·GCS·R2 등) 위에 Iceberg나 Delta Lake 같은 레이크하우스 포맷을 얹어 ACID(원자성·일관성·고립성·내구성)가 보장된 분석 평면을 만든다. 기존 RDBMS는 CDC(Change Data Capture — 변경 분만 추출하는 방식)로 흘려 보낸다. 임베딩 검색을 위해 pgvector나 Milvus, Weaviate를 추가한다. 컴퓨트 레이어는 쿠버네티스 위 GPU 노드풀에 MLflow·Kubeflow·Feature Store(Feast/Tecton)를 묶는다. 거버넌스 레이어는 Atlan·Collibra 같은 카탈로그와 Monte Carlo 같은 데이터 관측성 도구로 계보·품질·감사를 자동화한다.

2026년 시점 MLOps의 결정적 변화는 LLM/RAG/벡터 스토어 운영까지 포함하도록 범위가 넓어졌다는 점이다. 임베딩 드리프트 감지가 신규 모니터링 항목으로 들어왔고, 이는 데이터 레이어 변화 없이는 잡을 수 없다. 세 레이어가 한 회로 안에서 돈다.

한 레이어만 먼저 갈면 결국 셋 다 다시 짠다.

예산 비대칭 / 3

단계 1을 건너뛴 비용

단계 1, 즉 평가와 디스커버리에 1~3개월을 쓰는 일은 겉보기에 시간 낭비처럼 보인다. 코드 한 줄 안 쓰고 데이터 자산 카탈로그를 그리고, 6R 의사결정 트리(Rehost / Replatform / Refactor / Repurchase / Retire / Retain)로 워크로드를 나누고, 사용 사례를 우선순위화한다. 그러나 이 단계를 건너뛴 조직이 단계 4에서 평균 2~3배의 비용 폭증을 겪는다.

이유는 단순하다. 단계 1 부실은 데이터 품질 부채로 누적되고, 단계 4(거버넌스·관측성)에서 한꺼번에 청구된다. 1~10TB 중간 규모는 4~8개월에 끝나지만, 100TB 이상은 12~24개월이 시장 평균이다 (출처: SoluLab, Lumitech 2026 가이드). 의존하는 애플리케이션 수가 용량보다 더 큰 변수이며, AI 보조 마이그레이션 도구로 30~50%까지 단축은 가능하지만 단계 1 자체는 줄이지 못한다.

아래 차트는 단계 0에서 단계 6까지의 평균 일정을 100TB 이상 환경 기준으로 보여준다. 단계 2(데이터)와 단계 3(컴퓨트)은 병행되고, 단계 4(거버넌스)는 단계 2 후반에 시작해도 단계 5 컷오버 전엔 끝나야 한다. 즉 거버넌스를 미루면 컷오버 자체가 막힌다.

거버넌스를 미루면 컷오버 자체가 막힌다.

전환 단계별 평균 일정

100TB 이상 환경 기준 — 단계 4가 단계 5의 사전 조건

출처: SoluLab / Lumitech / Promethium 2026 가이드 종합

Takeaway 단계 4 거버넌스가 단계 5 컷오버의 사전 조건

규제 변곡 / 4

2026년 8월의 마감 — EU AI Act가 정하는 일정

왜 하필 2026년인가. 답은 규제다. 2026년 8월부터 EU AI Act의 고위험 시스템 조항이 시행된다. 채용·신용 평가·자동 고객 의사결정에 AI를 쓰면 즉시 대상이다. 위반 시 과징금 상한은 3,500만 유로 또는 글로벌 매출의 7% 가운데 큰 금액이다 (출처: Informatica, Kiteworks 2026 분석).

핵심은 이 조항이 기술 선택이 아니라 절차를 강제한다는 점이다. 모델 학습 데이터의 출처와 계보, 학습 과정 로그, 운영 중 모니터링, 사고 시 감사 trail이 의무 항목이 된다. 즉 단계 4(거버넌스·관측성)가 더 이상 '나중에 해도 되는' 영역이 아니다. 이 변화는 그동안 데이터 카탈로그와 계보 추적을 미뤄온 조직에 가장 무겁게 떨어진다.

실제로 2026년 IT 현대화 시장의 가격 구성에서 가장 빠르게 오르는 항목이 거버넌스 도구와 컴플라이언스 컨설팅이다. 기술 비용보다 인적 절차 정비가 더 큰 항목으로 떠올랐다는 보고가 다수 보고서에 공통으로 나타난다 (Towards Data Science, Governance Intelligence 2026). 이 변화는 EU 안에서 사업하지 않더라도 EU 시민 데이터를 다루는 한 적용되므로, 실질적으로 글로벌 기준이 된다.

이 조항은 기술 선택이 아니라 절차를 강제한다.

반대 가설 / 5

EB급은 정말 필요한가

여기서 한 번 멈추고 묻자. 정말 EB(엑사바이트)급이 필요한가.

사실 대부분 기업은 EB급이 필요 없다. 일반 중견 기업의 분석과 AI 작업은 페타바이트(PB) 미만으로 충분하다. EB급은 빅테크와 일부 대형 금융·통신의 영역이다. 그러나 EB급에서 검증된 설계 원칙은 그보다 작은 환경에 그대로 옮겨진다.

그 원칙의 핵심은 핫 티어와 콜드 티어의 비대칭이다. EB급 환경에서 NVMe 핫 티어는 전체 용량의 1~2%에 불과하지만, 읽기 요청의 60%를 처리한다 (출처: Introl 2026 분석). 즉 모든 데이터를 NVMe SSD에 둘 필요가 없다. 액세스 패턴 분석이 곧 비용 설계다.

이 통찰은 작은 환경에도 통한다. 단일 Samsung PM1735 NVMe 드라이브의 시퀀셜 읽기는 6.8 GB/s다. WekaFS나 VAST 같은 분산 파일시스템으로 수백 개를 묶으면 중견 기업의 RAG 운영 핫 풀로 충분하고도 남는다. 비싼 부분은 용량이 아니라 IOPS 분포다. 그래서 진짜 의제는 EB급 추구가 아니라, 액세스 패턴 기반 다층(multi-tier) 설계다.

비싼 것은 용량이 아니라 IOPS 분포다.

용량 분포 vs 읽기 분포 — 핫 티어의 비대칭

1~2% 용량이 60% 읽기를 처리 — 모든 데이터를 NVMe에 둘 필요 없음

출처: Introl — Data Lake Architecture for AI 2026 / EB급 환경 평균

Takeaway 용량이 아니라 IOPS 분포가 비용 구조를 결정

분기 / 6

분기점과 봉합 못 한 모순

앞 다섯 섹션의 결론을 시나리오 네 개로 정리한다. 가로축은 일어날 확률, 세로축은 비즈니스 영향이다.

첫 시나리오, 단계적 성공 — 디스커버리 6개월에 충실하고 세 레이어를 병행으로 18~24개월에 컷오버. 3년 누적 ROI 200~304%, 회수 기간 6~18개월. 가장 가능성이 높지만 인내가 든다.

둘째 시나리오, 빅뱅 후 폭증 — 단계 1을 압축하고 컷오버를 서두르다 단계 4에서 거버넌스 부채가 한꺼번에 청구. 예산이 2~3배로 폭증한다. 시장 평균 실패 사례에 가깝다.

셋째 시나리오, 규제 충돌 — 채용·신용 같은 고위험 영역에 AI를 먼저 깔았다가 2026년 8월 EU AI Act 시행과 함께 운영 일부를 멈추고 문서화에 6개월을 추가한다. 과징금까지 가는 사례는 드물지만 운영 중단 자체로도 ROI가 마이너스가 된다.

넷째 시나리오, 전략적 후퇴 — EB급을 포기하고 PB 미만 환경으로 재설계. 핫 티어 최적화에 집중. 비용은 가장 적지만 미래 확장성이 좁아진다. 단 대부분 기업에 가장 합리적인 선택일 가능성이 높다.

이 네 시나리오 사이에는 봉합되지 않는 모순이 있다. 어느 쪽을 먼저 들어줘야 하는지를 결정하는 일이 곧 전략 그 자체다.

어느 쪽을 먼저 들어주는가가 곧 전략 그 자체다.

시나리오 — 확률 × 영향

기준선이 가장 유력하나 빅뱅 폭증과 규제 충돌의 영향이 더 크다

출처: 본 보고서 자체 합성 — 출처별 평균 일정·비용 데이터 기반 추정

Takeaway 확률 분포는 평탄한데 영향 비대칭이 큼 — 위험 회피가 합리적

반대 관점 / 모순

봉합하지 않은 충돌

관점 A: 빅뱅 컷오버 — 한 번에 갈아엎어야 추진력이 살고 듀얼 시스템 운영 비용을 피한다

관점 B: Strangler Fig 점진 — 도메인별 점진 이관이 위험을 분산하고 사고 시 롤백을 가능하게 한다

근거 충돌: 100TB 이상 환경에서 빅뱅 사례는 평균 12~24개월, 점진 사례는 18~30개월. 그러나 빅뱅 실패 시 전면 롤백 비용이 점진 실패 시의 도메인 단위 롤백 대비 5배 이상

→ 현 시점은 점진 손을 들어준다. 단 연 매출 7% 과징금이 리얼한 고위험 도메인은 빅뱅으로 한 번에 EU AI Act 준수 상태에 도달하는 편이 합리적. 즉 도메인별 분기 결정이 옳다.

관점 A: RAG 우선 — 외부 문서 인덱싱과 벡터 검색만 깔면 자체 모델 학습 없이 LLM을 활용할 수 있다

관점 B: Fine-tuning 우선 — RAG는 인프라 부담이 크다. 도메인 특화 작은 모델을 미세조정하는 편이 추론 비용·지연시간이 더 낫다

근거 충돌: RAG는 벡터DB·임베딩·재순위 등 다층 인프라 필요. Fine-tuning은 학습 비용은 1회성이지만 모델 재학습 주기와 데이터 갱신 비용이 누적

→ 케이스 의존적이며 봉합되지 않는다. 출처 추적성이 규제 요건인 도메인은 RAG가 필수(출처 인용 가능). 추론 빈도가 매우 높은 도메인은 fine-tuning이 단가 우위. 둘을 결합하는 RAFT 패턴이 2026년 부상 중이지만 운영 사례가 아직 적다.

관점 A: EB급 인프라 추구 — 미래 데이터 폭증을 대비해 처음부터 EB급 설계를 도입해야 한다

관점 B: PB 미만 최적화 — 대부분 기업은 EB급이 필요 없다. 핫 티어 설계와 IOPS 분포 최적화로 충분하다

근거 충돌: EB급 마이그레이션은 5억 달러 초과 사례가 다수, 연간 IT 예산의 20~30% 잠식. 반면 핫 티어 1~2%가 60% 읽기를 처리하므로 PB 환경에서도 동일 원칙이 통함

→ 현 시점 PB 미만 최적화 손을 들어준다. 단 데이터 폭증이 검증된 빅테크·금융 일부는 EB급 설계가 합리적. 일반 기업이 'EB급 가능성'을 명분으로 비용을 부풀리는 패턴이 가장 흔한 함정이다.

앞으로 무엇을 볼까

감시 신호

⚖️ EU AI Act 고위험 시스템 시행

2026년 8월부터 채용·신용·자동 고객 의사결정 AI에 즉시 적용

→ 규제 충돌 시나리오 발화 여부 — 시행 직후 분기 결정

2026-08-02

🗂️ 자사 데이터 자산 카탈로그 완성

Atlan/Collibra/OvalEdge 등으로 데이터 계보 자동 추적 도입 완료 시점

→ 단계 1 디스커버리 충실도 — 단계 4 비용 폭증 위험 사전 차단 여부

🧠 첫 RAG 파이프라인 운영 전환

임베딩 저장·검색·드리프트 감지가 모두 자동화된 첫 운영 케이스

→ 데이터·컴퓨트 레이어 동시 가동 여부 — 단계 2~3 통합도

💰 GPU 클라우드 vs 자체 비용 곡선 교차점

매니지드 클라우드 GPU 시간당 비용과 자체 노드풀 TCO 교차 시점

→ 컴퓨트 레이어 인프라 자가 운영으로의 전환 타이밍

📡 임베딩 드리프트 모니터링 도입

Monte Carlo 류 데이터 관측성 도구로 임베딩 품질 변화 자동 감지

→ MLOps 운영 성숙도 — 모델 안정성 사후 보정 vs 사전 감지 분기

신뢰도 (72%)

출처 16건이 컨설팅·기술 블로그·규제 분석으로 다양하나, 비용·일정 수치는 대부분 2026년 가이드의 종합치라 단일 산업 일반화는 주의. EU AI Act 조항·과징금 상한은 1차 규제 텍스트와 일치. 시나리오 확률은 본 보고서 합성치임을 명시.

분석가의 한계

결정의 시계는 길다. 디스커버리 6개월에 충실한 출발이 12개월 늦은 출발보다 결국 빠르다. 2026년 8월의 마감은 이 사실을 사후가 아니라 사전에 가르친다.