AI Transformation 인프라 (AX Infra)
개요
AX Infra(AI Transformation Infrastructure)는 단순한 단일 LLM API 호출을 넘어, 기업 환경에서 신뢰성 있게 동작하는 에이전트(Agent) 기반의 시스템 규모를 지원하기 위한 필수적인 기술 토대입니다.
PoC(Proof of Concept) 단계에서 주로 겪는 확장성, 관측 부재, 상태 관리의 어려움(참고: PoC와 Production 사이의 간극)을 극복하고 에이전틱 엔터프라이즈(Agentic Enterprise)로 나아가기 위해서는 기존 웹/앱 아키텍처와는 구별되는 새로운 인프라 생태계가 필요합니다.
AX 인프라 아키텍처 (AX Infra Architecture)
graph TD
%% User Layer
User((User / App))
%% Core Infrastructure
subgraph "AX Infrastructure (The 5 Pillars)"
direction TB
%% Orchestration as the center
Orch["<b>4. Orchestration & Workflow</b><br/>(LangGraph, Temporal, Airflow)"]
subgraph "Resources & Tools"
direction LR
Gateway["<b>1. Model Serving</b><br/>(LiteLLM, vLLM, Ollama)"]
Memory["<b>2. Memory & Vector DB</b><br/>(Milvus, Qdrant, Redis)"]
Sandbox["<b>5. Execution Sandbox</b><br/>(E2B, Docker, WASM)"]
end
%% Monitoring
Obs["<b>3. Observability & Evaluation</b><br/>(Langfuse, LangSmith, Phoenix)"]
end
%% Connections
User --> Orch
Orch <--> Gateway
Orch <--> Memory
Orch <--> Sandbox
%% Monitoring lines
Orch -.-> Obs
Gateway -.-> Obs
Memory -.-> Obs
Sandbox -.-> Obs
%% Styles
style Orch fill:#f9f,stroke:#333,stroke-width:2px
style Gateway fill:#bbf,stroke:#333
style Memory fill:#bfb,stroke:#333
style Sandbox fill:#fbb,stroke:#333
style Obs fill:#eee,stroke:#333,stroke-dasharray: 5 5
핵심 인프라 영역 (The 5 Pillars)
현재 에이전틱 AI 아키텍처에서 시스템을 프로덕션(Production) 레벨로 올리기 위해 필수적으로 고려되는 5대 인프라 영역은 다음과 같습니다.
1. 모델 서빙 및 API 게이트웨이
LLM 자원을 효율적으로 할당하고, 수많은 AI 모델(OpenAI, Anthropic, 로컬 모델 등)에 대한 일관된 라우팅과 로드 밸런싱을 제공합니다.
- 주요 스택: LiteLLM, vLLM, Ollama
2. 메모리 및 통합 데이터 저장소
에이전트가 과거의 대화 맥락(Context)을 기억하고, 파일 시스템을 활용해 상태를 보존하며, 기존 관계형 DB(RDBMS)나 지식 베이스에서 필요한 팩트를 인출할 수 있도록 돕는 저장소 생태계입니다.
- 주요 스택: Milvus, Qdrant, Chroma, Redis, PostgreSQL (NL2SQL 연동)
- 연관 기술: Agent Memory, RAG
3. 관측 가능성 및 평가 (Observability & LLMOps)
블랙박스처럼 동작하는 에이전트의 사고 과정(추론, 검색, 도구 사용 등)을 시각화하고, 비용(토큰)과 답변 품질을 추적합니다.
- 주요 스택: Langfuse, LangSmith, Arize Phoenix
- 연관 기술: LLMOps/Langfuse
4. 오케스트레이션 및 워크플로우 (Orchestration)
멀티 에이전트의 복잡한 비동기 작업 흐름을 제어하고, 장애 발생 시 롤백 및 상태 복구(Durable Execution)를 보장합니다.
- 주요 스택: Temporal, Apache Airflow, LangGraph
5. 실행 샌드박스 (Execution Sandbox)
에이전트가 코드를 작성하여 실행하거나, 시스템 장애를 유발할 수 있는 외부 도구를 호출할 때 격리된 안전한 환경(Security Boundary)을 제공합니다.
- 주요 스택: E2B, Docker, WebAssembly
인프라 통합 환경 구축
앞서 설명한 5대 핵심 인프라 영역들을 프로덕션 레벨에서 단일 시스템으로 묶어서 띄우고 오토스케일링(Auto-scaling)하는 방안은 아래 문서를 참고하십시오.
- 인프라 배포 및 운영 전략 (Kubernetes & Docker)
- K9s (Kubernetes CLI UI): 안정적인 쿠버네티스 클러스터 모니터링과 생산성 향상을 위한 터미널 기반 관리 도구
- Argo CD (GitOps CD 도구): Git을 단일 진실 공급원으로 삼는 GitOps 기반 지속적 배포. Self-healing, App of Apps, ApplicationSet, External Secrets 연동.
- Kubernetes Ingress & AGIC: 외부 트래픽을 내부 서비스로 L7 라우팅. 경로·Host 기반 라우팅, Ingress Controller 개념, cert-manager 자동 인증서 발급.
- Istio (Service Mesh): 클러스터 내부 East-West 트래픽 제어. 사이드카(Envoy), 카나리 배포, 서킷 브레이커, mTLS 자동 암호화, Kiali·Jaeger 가시성.
클라우드 플랫폼별 배포 가이드
특정 클라우드 플랫폼의 네이티브 서비스를 활용한 프로덕션 배포 전략은 아래를 참고하십시오.
- Azure Cloud 배포 (AI 프로덕션): AKS, Application Gateway, ACR, Key Vault, Azure Monitor를 활용한 Azure 기반 AI 서비스 프로덕션 배포 완전 가이드