GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Artificial Intelligence and Deep Learning
Presentation
Media
基于 GPU 的大规模音频理解和合成解决方案
Abstract:
本篇报告主要介绍字节跳动人工智能实验室目前在音频理解和合成两个方向的技术实践和应用落地。音频理解主要服务于字节系视频和直播场景,应用于视频搜索、推荐和字幕等;音频合成主要服务于字节系文本信息场景,应用于有声新闻、小说等。音频理解和合成两个方向承接的业务众多,请求量大,功能迭代迅速,效果要求高,一方面需要搭建大规模分布式训练方案,持续保证模型迭代效率和效果,另一方面需要构建高性能推理框架,适配快速迭代的模型结构和框架,极大化利用计算资源完成请求。报告将介绍团队目前在构建基于GPU的训练方案和推理框架上的工作和实际应用效果。
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9674
Download:
Share: