CMP301L300Compute
AWS Trainium 기반 LLM 추론 A to Z: Neuron 환경 이해부터 성능 최적화까지
일정
Day 2 · AI Day (5/21 목)
시간
16:10 – 16:50
장소
그랜드볼룸(1F) 103
유형
브레이크아웃 세션
세션 소개
생성형 AI의 빠른 확산과 함께 대규모 언어 모델(LLM)의 효율적인 추론은 기업들의 핵심 과제가 되었습니다. 본 세션에서는 AWS 전용 AI 칩인 Trainium과 Neuron SDK 생태계를 활용하여 LLM 추론의 전체 파이프라인을 체계적으로 다룹니다. 실습 데모에서는 Qwen3 모델에 NKI(Neuron Kernel Interface) 최적화 커널을 적용하여 처리량과 지연시간 모두에서 의미 있는 성능 향상을 달성하는 과정을 단계별로 시연합니다. 또한 re:Invent에서 발표된 Neuron Explorer, NKI Library 등 최신 도구들과 실제 고객 사례를 통해 비용 효율적인 LLM 추론 인프라 구축을 위한 실용적인 가이드를 제공합니다.
발표자
- 이
이수지
GTM 가속 컴퓨팅 전문 솔루션즈 아키텍트 · AWS
- 차
차수정
딥러닝 아키텍트 · AWS
같은 시간대 (8)
- SecuritySEC20216:10
신뢰할 수 있는 KMS 아키텍처의 진화와 서명키 관리 전략
정관진, 문민아
- Migration & ModernizationMAM30216:10
AIOps 도전과 실전: AI SecOps에서 DevOps 에이전트까지
이연수, 박종진 외 1명
- Developer ToolsDVT30516:10
Nova Act & Strands Agent 실전: AI 에이전트로 개발 워크플로 자동화하기
김예진, 안수진
- Developer ToolsDVT30316:10
프로덕션으로 가기 위한 에이전틱 AI 아키텍처 설계하기
이유정, 류하선
- DeveloperDEV30616:10
AWS Kiro로 가속하는 IaC 혁신과 레거시 전환
양승만, 윤병찬
- AnalyticsANT20216:10
나야, 차세대 OpenSearch: 에이전틱 AI를 곁들인
김새름, 이승철