GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Artificial Intelligence and Deep Learning
Presentation
Media
分析深度学习网络模型及自动混合精度以优化性能
Abstract:
深度学习性能分析工具(DLProf)是一种对深度学习模型的训练过程进行性能分析的工具,其可帮助数据科学家通过 Tensorboard 或者文本报告来理解并提高模型的训练效率。DLProf 可展示训练中最耗时的10个操作以及 Tensor Core 的利用情况,帮助用户轻松地了解并可视化训练效率。自动混合精度(AMP)为训练深度学习模型提供了一种快捷启用 Tensor Core 的方法。其借助 Tensor Core 并采用混合计算精度模式,可以带来显著的计算加速。本讲座将帮您全面了解 DLProf 和 AMP。 AMP 借助 Tensor Core 可以直接为您的模型训练提供加速。而DLProf 将有助于验证 Tensor Core 的使用情况并进一步为您指出优化方向。
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9620
Download:
Share: