CMP401L400Compute
대규모 분산 학습 AWS ParallelCluster 로 시작하기
일정
Day 2 · AI Day (5/21 목)
시간
11:10 – 11:50
장소
그랜드볼룸(1F) 103
유형
브레이크아웃 세션
세션 소개
이 세션에서는 AWS ParallelCluster를 중심으로 분산 학습 인프라의 핵심 구성 요소를 설명하고, 실제 클러스터를 구성·운영하면서 겪은 AMI 빌드 전략, 모니터링, 노드 장애 복구 등 실전 경험을 공유합니다. 인프라 팀부터 ML 엔지니어까지, GPU 클러스터를 처음 설계하거나 운영 안정성을 높이려는 분들을 위한 세션입니다.
발표자
- 조
조소현
솔루션즈 아키텍트 · AWS
- 이
이수정
테크니컬 어카운트 매니저 · AWS
같은 시간대 (7)
- SecuritySEC30111:10
AI 보안심화: AI 워크로드에 대한 심층방어 체계 구축
신은수, 신안셀모
- Migration & ModernizationMAM20111:10
기술 부채의 한계를 넘어 AI-Ready 비즈니스로: AWS가 제안하는 에이전틱 AI 마이그레이션
전소영, 김세진
- Developer ToolsDVT20111:10
에이전틱 AI로 완전히 달라지는 소프트웨어와 개발 방법
구태훈
- DeveloperDEV30411:10
장애에 강한 팀: 서버리스 온콜과 서비스 모니터링
김수빈, 이태근
- AnalyticsANT30511:10
에이전틱 AI를 위한 데이터 실무 가이드
김기영, 이종혁
- AI & Machine LearningAIM30511:10
21억 사용자규모 삼성 어카운트의 에이전틱 AIOps on AWS
박규태, 이준영