홈›AI Infra

AI Infra
GPU 기반 AI 인프라

GPU 클러스터 기반 AI 인프라를 구축하고 운영합니다.
CoreLab Cluster로 AI 학습/추론 환경의 고가용성을 보장합니다.

핵심 기능

NVIDIA H200 / H100 / L40S / RTX A6000 등 최신 GPU 기반 클러스터 설계 및 구축.
NVLink, InfiniBand 네트워크 최적화로 다중 GPU 학습 성능을 극대화합니다.

GPU 서버 장애 시 자동 Failover로 학습/추론 서비스 중단을 방지.
CoreLab Cluster로 99.99% 가용성을 보장합니다.

NVMe 기반 고속 공유 스토리지로 모델 체크포인트 및 데이터셋을
클러스터 노드 간 실시간 동기화합니다.

GPU utilization, VRAM, 온도, 전력 소모를 실시간 모니터링.
학습 작업의 리소스 사용률을 대시보드에서 한눈에 확인합니다.

HBM3e 141GB · NVLink 4.0

최대 메모리 대역폭, LLM 학습 최적화

HBM3 80GB · NVLink 4.0

대규모 LLM 학습 최적화

GDDR6 48GB · PCIe Gen4

추론 및 생성 AI에 최적화

GDDR6 48GB · PCIe Gen4

다양한 워크로드에 경제적인 GPU 옵션

컴퓨팅	GPU 서버 2대 이상 (Active-Standby / Multi-GPU)
네트워크	InfiniBand NDR 400Gbps
스토리지	NVMe SSD 공유 스토리지 (모델/데이터셋 동기화), 로컬 디스크(NVMe) 복제(A-A 구성)
플랫폼	NVIDIA CUDA, Docker, Kubernetes (선택)
고가용성	CoreLab Cluster — 자동 Failover, 실시간 동기화, 웹 콘솔 관리