GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Artificial Intelligence and Deep Learning
Presentation
Media
针对深度学习的汇编级优化-快速提高应用性能
Abstract:
本次分享主要介绍Pascal架构的下的汇编优化方法,以矩阵乘法与卷积为例来介绍,如何在汇编层面提升访存和计算效率,来超越已有矩阵乘法与卷积的实现。 滴滴 AI-智能加速引擎 IFX,旨在提供一个高吞吐,低时延的推理引擎,支持 TensorFlow、PyTorch、Caffe、DarkNet 等主流框架的模型,使用低精度量化、图优化、汇编优化算子等方法提升模型性能。本次介绍 IFX 在滴滴内部的部署和实践分享。
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9667
Streaming:
Download:
Share: