CMP401L400Compute

대규모 분산 학습 AWS ParallelCluster 로 시작하기

일정

Day 2 · AI Day (5/21 목)

시간

11:10 – 11:50

장소

그랜드볼룸(1F) 103

유형

브레이크아웃 세션

세션 소개

이 세션에서는 AWS ParallelCluster를 중심으로 분산 학습 인프라의 핵심 구성 요소를 설명하고, 실제 클러스터를 구성·운영하면서 겪은 AMI 빌드 전략, 모니터링, 노드 장애 복구 등 실전 경험을 공유합니다. 인프라 팀부터 ML 엔지니어까지, GPU 클러스터를 처음 설계하거나 운영 안정성을 높이려는 분들을 위한 세션입니다.

발표자

  • 조소현

    솔루션즈 아키텍트 · AWS

  • 이수정

    테크니컬 어카운트 매니저 · AWS

같은 시간대 (7)

같은 트랙