GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

HPC and AI
Presentation
Media
大规模 AI 集群网络技术
Abstract:
本演讲介绍百度大规模 AI 集群的网络设计。百度 AI 集群使用海量的 NVIDIA GPU 承载了大多数的百度分布式 AI 训练任务。在构建这样的大规模 AI 集群时,网络设计起到了至关重要的作用。本演讲从接入带宽、网络架构、 RDMA 、通信算法、任务调度等各个层面详解了高性能、高可用的大规模 AI 集群设计的主要考量。
 
Topics:
HPC and AI
Type:
Talk
Event:
GTC China
Year:
2020
Session ID:
CNS20395
Download:
Share: