GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Artificial Intelligence and Deep Learning
Presentation
Media
基于 T4 的推荐系统推理性能优化
Abstract:
基于神经网络的推荐模型已经普遍应用于各种电商和社交媒体网站的推荐系统中,常见的推荐系统推理采用 CPU 进行,但是当推荐系统需要对越来越多的商品进行排序时,CPU 已经无法满足推荐系统的实时性和吞吐率。本文基于 T4 提供的算力,对推荐系统的推理性能进行了优化,包括 Node Placement、FP16 量化以及图转换三种优化方式,将推荐系统的推理性能提高了 3.9 倍。
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9608
Streaming:
Download:
Share: