AIM302L300AI & Machine Learning
하이퍼커넥트의 HyperPod 기반 Slurm on EKS 도입기
일정
Day 2 · AI Day (5/21 목)
시간
12:50 – 13:30
장소
오디토리움(3F)
유형
브레이크아웃 세션
세션 소개
본 세션은 SageMaker HyperPod에서 Slurm 워크플로우를 유지하면서 쿠버네티스의 운영 효율을 확보한 하이퍼커넥트의 Slurm on EKS 도입 사례와 전환 과정의 교훈을 공유합니다. 또한 네트워크 기반 메모리 복제로 2분 내 장애 복구를 실현하고 95% 이상의 Goodput을 유지하는 Checkpointless Training과 Elastic Training 업데이트도 다룹니다.
발표자
- 오
오준석
시니어 솔루션즈 아키텍트 · AWS
- 현
현륜식
솔루션즈 아키텍트 · AWS
- 윤
윤보현
머신러닝 S/W 엔지니어 · 하이퍼커넥트
같은 시간대 (9)
- SecuritySEC20112:50
Agent-Driven 개발 환경, 보안 강화 전략은?
이지영, 한태경
- Migration & ModernizationMAM30112:50
AI 에이전트, AgentCore로 프로덕션까지
이광우, 송민지 외 1명
- Developer ToolsDVT20512:50
Strands Agents와 함께 스스로 진화하는 AI 에이전트
김제삼, 박경수
- Developer ToolsDVT20312:50
AI 기반 개발 라이프사이클(AI-DLC) 소개
김수연, 박태진
- DeveloperDEV31012:50
AgentCore/Lambda를 활용한 100% Serverless 에이전틱 AI 구현 및 운영
박상운
- DeveloperDEV30712:50
Kiro Spec 모드 가속 가이드 & 서버리스 CDC 레이크하우스
최지연, 강은호