SEARCH SESSIONS
SEARCH SESSIONS

Search All
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Artificial Intelligence and Deep Learning
Presentation
Media
主题演讲 (Keynote Talk)
Abstract:
NVIDIA 创始人兼 CEO 黄仁勋(Jensen Huang)关于计算未来的主题演讲。
 
Topics:
Artificial Intelligence and Deep Learning, Intelligent Machines, IoT & Robotics, Autonomous Vehicles, Deep Learning & AI Frameworks
Type:
Keynote
Event:
GTC China
Year:
2019
Session ID:
CN9539
Streaming:
Share:
 
Abstract:
深度学习性能分析工具(DLProf)是一种对深度学习模型的训练过程进行性能分析的工具,其可帮助数据科学家通过 Tensorboard 或者文本报告来理解并提高模型的训练效率。DLProf 可展示训练中最耗时的10个操作以及 Tensor Core 的利用情况,帮助用户轻松地了解并可视化训练效率。自动混合精度(AMP)为训练深度学习模型提供了一种快捷启用 Tensor Core 的方法。其借助 Tensor Core 并采用混合计算精度模式,可以带来显著的计算加速。本讲座将帮您全面了解 DLProf 和 AMP。 AMP 借助 Tensor Core 可以直接为您的模型训练提供加速。而DLProf 将有助于验证 Tensor Core 的使用情况并进一步为您指出优化方向。 ...Read More
Abstract:
深度学习性能分析工具(DLProf)是一种对深度学习模型的训练过程进行性能分析的工具,其可帮助数据科学家通过 Tensorboard 或者文本报告来理解并提高模型的训练效率。DLProf 可展示训练中最耗时的10个操作以及 Tensor Core 的利用情况,帮助用户轻松地了解并可视化训练效率。自动混合精度(AMP)为训练深度学习模型提供了一种快捷启用 Tensor Core 的方法。其借助 Tensor Core 并采用混合计算精度模式,可以带来显著的计算加速。本讲座将帮您全面了解 DLProf 和 AMP。 AMP 借助 Tensor Core 可以直接为您的模型训练提供加速。而DLProf 将有助于验证 Tensor Core 的使用情况并进一步为您指出优化方向。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9620
Download:
Share:
 
Abstract:
在本演讲中,会分享 PAI 团队过去一年多时间里在通用推理优化工具 Blade 上围绕 NVIDIA GPU 硬件的工作进展,包括模型优化、编译优化以及其他系统优化工作,并会结合一些业务案例来展示这些优化工作的成果。我们首先会分享模型结构驱动的优化方法论,基于这套方法论,会针对具体模型,结合底层 GPU 的硬件特性,为不同的计算 building block 选择合理的优化策略,从而使得上层业务模型和底层硬件之间建立更高效性能映射成为可能。基于选定的优化策略,会执行具体的优化实现细节,比如对于高频计算 pattern 会充分挖掘手工优化和底层计算库的性能极限,对于长尾计算 pattern 会基于编译优化技术来进行通用性打击覆盖,对于部分计算热点子图会通过模型压缩的方式来降低理论算力需求并通过系统优化进行配合以确保理论加速比和实际加速比之间的对齐。在优化技术之外同时会介绍在 Blade 开发布署过程中一些实际的工程相关经验,因为只有优化,欠缺了整体系统的考量,很可能会导致优化工作因为最后一公里不能真正在业务中发挥价值,并结合一些实际业务案例来展示完整的优化工作成果。 ...Read More
Abstract:
在本演讲中,会分享 PAI 团队过去一年多时间里在通用推理优化工具 Blade 上围绕 NVIDIA GPU 硬件的工作进展,包括模型优化、编译优化以及其他系统优化工作,并会结合一些业务案例来展示这些优化工作的成果。我们首先会分享模型结构驱动的优化方法论,基于这套方法论,会针对具体模型,结合底层 GPU 的硬件特性,为不同的计算 building block 选择合理的优化策略,从而使得上层业务模型和底层硬件之间建立更高效性能映射成为可能。基于选定的优化策略,会执行具体的优化实现细节,比如对于高频计算 pattern 会充分挖掘手工优化和底层计算库的性能极限,对于长尾计算 pattern 会基于编译优化技术来进行通用性打击覆盖,对于部分计算热点子图会通过模型压缩的方式来降低理论算力需求并通过系统优化进行配合以确保理论加速比和实际加速比之间的对齐。在优化技术之外同时会介绍在 Blade 开发布署过程中一些实际的工程相关经验,因为只有优化,欠缺了整体系统的考量,很可能会导致优化工作因为最后一公里不能真正在业务中发挥价值,并结合一些实际业务案例来展示完整的优化工作成果。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9992
Streaming:
Download:
Share:
 
Abstract:
应用深度学习,开发人员可以构建预测模型,解决诸如计算机视觉、自然语言处理或机器翻译等复杂问题。在本节中,我们将展示如何使用多个 GPU 实例来加速当前最复杂的机器学习模型的训练。此外,您还将学习如何在GPU实例上开始使用深度学习框架,例如 Apache MXNet。或者从 Amazon SageMaker 开始,这个平台允许任何开发人员轻松地培训和部署机器学习模型。对于边缘推理,我们将深入 SageMaker Neo,并向您展示该功能如何自动优化基于 TensorFlow、Apache MXNet、PyTorch 和 ONNX 构建的模型 ...Read More
Abstract:
应用深度学习,开发人员可以构建预测模型,解决诸如计算机视觉、自然语言处理或机器翻译等复杂问题。在本节中,我们将展示如何使用多个 GPU 实例来加速当前最复杂的机器学习模型的训练。此外,您还将学习如何在GPU实例上开始使用深度学习框架,例如 Apache MXNet。或者从 Amazon SageMaker 开始,这个平台允许任何开发人员轻松地培训和部署机器学习模型。对于边缘推理,我们将深入 SageMaker Neo,并向您展示该功能如何自动优化基于 TensorFlow、Apache MXNet、PyTorch 和 ONNX 构建的模型  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9812
Streaming:
Download:
Share:
 
Abstract:
随着 AI 模型复杂度与数据规模的增大,AI 面临着巨大的计算挑战,训练端的计算性能与扩展效率,推理端的计算延时与并发吞吐。本报告将针对训练与推理的计算特点从 AI 计算平台架构优化、AI 系统管理优化、AI 计算框架的高度并行与扩展优化、AI 应用实现优化四个维度来详细介绍基于 GPU 的计算优化方法,并结合 Facenet 人脸识别算法进行案例分析其实现效果。 ...Read More
Abstract:
随着 AI 模型复杂度与数据规模的增大,AI 面临着巨大的计算挑战,训练端的计算性能与扩展效率,推理端的计算延时与并发吞吐。本报告将针对训练与推理的计算特点从 AI 计算平台架构优化、AI 系统管理优化、AI 计算框架的高度并行与扩展优化、AI 应用实现优化四个维度来详细介绍基于 GPU 的计算优化方法,并结合 Facenet 人脸识别算法进行案例分析其实现效果。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9161
Streaming:
Download:
Share:
 
Abstract:
为推进 AI+ 游戏相关技术能力的提升,腾讯研发了一套可扩展的异步并行强化学习框架和强化学习平台。目前平台拥有上百万核 CPU 弹性资源和上万块卡的 GPU 资源,接入了 MOBA 类、FPS 类等多种复杂游戏。其中在 5v5 MOBA 游戏上,通过平台每天可以自对奕并训练上千万局游戏,目前腾讯的策略协作型 AI“ 绝悟”能力已经到达电竞选手职业水平。 ...Read More
Abstract:
为推进 AI+ 游戏相关技术能力的提升,腾讯研发了一套可扩展的异步并行强化学习框架和强化学习平台。目前平台拥有上百万核 CPU 弹性资源和上万块卡的 GPU 资源,接入了 MOBA 类、FPS 类等多种复杂游戏。其中在 5v5 MOBA 游戏上,通过平台每天可以自对奕并训练上千万局游戏,目前腾讯的策略协作型 AI“ 绝悟”能力已经到达电竞选手职业水平。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9835
Share:
 
Abstract:
本演讲的核心技术主要涉及到飞桨的 GPU 多机多卡训练,包括 GPU 多机多卡训练基础能力,将从整体设计、用户接口、通信优化组件等方面介绍飞桨在 GPU 分布式训练方面所做的基础工作。此外,也将介绍飞桨在大规模分类方面的采用的模型并行技术以及低配网络通信环境下的并行训练能力。参会者不仅可以对飞桨在 GPU 多机训练方面的工作有比较全面的认识,而且还能够上手进行一些实验,体验飞桨给开发者带来的高性能训练功能。 ...Read More
Abstract:
本演讲的核心技术主要涉及到飞桨的 GPU 多机多卡训练,包括 GPU 多机多卡训练基础能力,将从整体设计、用户接口、通信优化组件等方面介绍飞桨在 GPU 分布式训练方面所做的基础工作。此外,也将介绍飞桨在大规模分类方面的采用的模型并行技术以及低配网络通信环境下的并行训练能力。参会者不仅可以对飞桨在 GPU 多机训练方面的工作有比较全面的认识,而且还能够上手进行一些实验,体验飞桨给开发者带来的高性能训练功能。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9879
Download:
Share:
 
Abstract:
机器学习领域继续朝着多个方向显示爆炸性增长,并且随着它的成熟,围绕硬件性能、可扩展性以及以人为中心的 AI工具的隐私隐含性提出了新的复杂的问题。 从本演讲中你会了解到最新版本的 PyTorch 如何通过在新平台上启用和加速机器学习来解决这些更深层次的问题,涉及在 GPU 上提供分布式培训、专注性能的工具(包括即时 JIT 编译器)以及用于组织机器学习代码的高级抽象 , 以及来自 Facebook 以及其他公司和研究机构的示例,用于说明 PyTorc 应用的各种用例。 ...Read More
Abstract:
机器学习领域继续朝着多个方向显示爆炸性增长,并且随着它的成熟,围绕硬件性能、可扩展性以及以人为中心的 AI工具的隐私隐含性提出了新的复杂的问题。 从本演讲中你会了解到最新版本的 PyTorch 如何通过在新平台上启用和加速机器学习来解决这些更深层次的问题,涉及在 GPU 上提供分布式培训、专注性能的工具(包括即时 JIT 编译器)以及用于组织机器学习代码的高级抽象 , 以及来自 Facebook 以及其他公司和研究机构的示例,用于说明 PyTorc 应用的各种用例。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9624
Streaming:
Download:
Share:
 
Abstract:
NEMO 是基于 PyTorch 基础上搭建 AI 应用的工具箱。我们创建 NEMO 是为了使 AI 应用的创建能够有可重复性,抽象性和组建性。NEMO 的概念是让每一个模块代表一个 AI 驱使的神经网路的应用: 数据层面,编译器,解译器,语言模型等等。NEMO 的工具箱由可以延伸的AI模块, 比如: 语言处理,语音识别等。我们将展示如何使用 NEMO 来训练语音识别和自然语言处理模型,并且同时使用到 Tensor cor 和分布式训练。我们会用 Jasper,CNN 基础上搭建的神经网络用来做语音处理。NEMO 的简单,透明性可以让用户们很快理解并且改变和整合自然语言处理和语音识别模型。 ...Read More
Abstract:
NEMO 是基于 PyTorch 基础上搭建 AI 应用的工具箱。我们创建 NEMO 是为了使 AI 应用的创建能够有可重复性,抽象性和组建性。NEMO 的概念是让每一个模块代表一个 AI 驱使的神经网路的应用: 数据层面,编译器,解译器,语言模型等等。NEMO 的工具箱由可以延伸的AI模块, 比如: 语言处理,语音识别等。我们将展示如何使用 NEMO 来训练语音识别和自然语言处理模型,并且同时使用到 Tensor cor 和分布式训练。我们会用 Jasper,CNN 基础上搭建的神经网络用来做语音处理。NEMO 的简单,透明性可以让用户们很快理解并且改变和整合自然语言处理和语音识别模型。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9749
Streaming:
Download:
Share:
 
Abstract:
本篇报告主要介绍字节跳动人工智能实验室目前在音频理解和合成两个方向的技术实践和应用落地。音频理解主要服务于字节系视频和直播场景,应用于视频搜索、推荐和字幕等;音频合成主要服务于字节系文本信息场景,应用于有声新闻、小说等。音频理解和合成两个方向承接的业务众多,请求量大,功能迭代迅速,效果要求高,一方面需要搭建大规模分布式训练方案,持续保证模型迭代效率和效果,另一方面需要构建高性能推理框架,适配快速迭代的模型结构和框架,极大化利用计算资源完成请求。报告将介绍团队目前在构建基于GPU的训练方案和推理框架上的工作和实际应用效果。 ...Read More
Abstract:
本篇报告主要介绍字节跳动人工智能实验室目前在音频理解和合成两个方向的技术实践和应用落地。音频理解主要服务于字节系视频和直播场景,应用于视频搜索、推荐和字幕等;音频合成主要服务于字节系文本信息场景,应用于有声新闻、小说等。音频理解和合成两个方向承接的业务众多,请求量大,功能迭代迅速,效果要求高,一方面需要搭建大规模分布式训练方案,持续保证模型迭代效率和效果,另一方面需要构建高性能推理框架,适配快速迭代的模型结构和框架,极大化利用计算资源完成请求。报告将介绍团队目前在构建基于GPU的训练方案和推理框架上的工作和实际应用效果。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9674
Download:
Share:
 
Abstract:
本篇报告主要介绍深度语义匹配模型在搜狗搜索引擎上的一些实践工作。 搜索引擎对各个模块的响应时间要求比较苛刻,目前主流的深度学习模型,在 CPU 上的计算时间都达不到要求,为此搜狗引入了 GPU 服务,将用户查询和一部分经过粗筛的网页内容,交给 GPU 服务进行相关性计算,并将结果返回,能极大地降低相关性计算的响应时间,并且能通过复杂模型带来相关性特征精确度的提升。 搜狗搜索的语义匹配模型,主要是通过各种较复杂深度学习模型来计算用户查询和网页内容的相关程度,这些模型也同样适用于问答系统和推荐系统。 本演讲将从搜狗搜索早期的语义匹配模型开始,详细介绍搜狗搜索的语义匹配模型是如何逐渐进化的,我们会重点介绍BERT模型在搜狗搜索中的应用。 ...Read More
Abstract:
本篇报告主要介绍深度语义匹配模型在搜狗搜索引擎上的一些实践工作。 搜索引擎对各个模块的响应时间要求比较苛刻,目前主流的深度学习模型,在 CPU 上的计算时间都达不到要求,为此搜狗引入了 GPU 服务,将用户查询和一部分经过粗筛的网页内容,交给 GPU 服务进行相关性计算,并将结果返回,能极大地降低相关性计算的响应时间,并且能通过复杂模型带来相关性特征精确度的提升。 搜狗搜索的语义匹配模型,主要是通过各种较复杂深度学习模型来计算用户查询和网页内容的相关程度,这些模型也同样适用于问答系统和推荐系统。 本演讲将从搜狗搜索早期的语义匹配模型开始,详细介绍搜狗搜索的语义匹配模型是如何逐渐进化的,我们会重点介绍BERT模型在搜狗搜索中的应用。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9725
Streaming:
Download:
Share:
 
Abstract:
当今科研人员不断研发新的深度学习网络结构、算法、及优化方法来推动AI领域的革新。NVIDIA GPU为加速深度学习各个领域的应用(计算机视觉、自然语言处理等)提供了强大的硬件和软件平台支持。我们将介绍如何在可扩展GPU系统上加速深度学习应用,以BERT为例展示如何一步步将应用从单GPU扩展到多GPU,再扩展到多GPU节点的大规模GPU系统上。 ...Read More
Abstract:
当今科研人员不断研发新的深度学习网络结构、算法、及优化方法来推动AI领域的革新。NVIDIA GPU为加速深度学习各个领域的应用(计算机视觉、自然语言处理等)提供了强大的硬件和软件平台支持。我们将介绍如何在可扩展GPU系统上加速深度学习应用,以BERT为例展示如何一步步将应用从单GPU扩展到多GPU,再扩展到多GPU节点的大规模GPU系统上。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9560
Streaming:
Download:
Share:
 
Abstract:
作为全球领先的生活服务电子商务平台,美团点评拥有围绕吃喝玩乐全场景的丰富数据,通过使用深度学习技术以及自然语言处理技术,对这些跨场景数据进行充分挖掘、映射、聚合与关联,基于NVIDIA GPU的加速,美团NLP中心构建了一个全世界最大的餐饮娱乐知识图谱——“美团大脑”,来促进每个场景下应用服务的智能升级。在这个报告中,我们将介绍知识图谱的行业现状、“美团大脑”的构建方法、以及目前在搜索推荐、赋能商家等方面的一些进展与落地场景 ...Read More
Abstract:
作为全球领先的生活服务电子商务平台,美团点评拥有围绕吃喝玩乐全场景的丰富数据,通过使用深度学习技术以及自然语言处理技术,对这些跨场景数据进行充分挖掘、映射、聚合与关联,基于NVIDIA GPU的加速,美团NLP中心构建了一个全世界最大的餐饮娱乐知识图谱——“美团大脑”,来促进每个场景下应用服务的智能升级。在这个报告中,我们将介绍知识图谱的行业现状、“美团大脑”的构建方法、以及目前在搜索推荐、赋能商家等方面的一些进展与落地场景  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9485
Download:
Share:
 
Abstract:
HugeCTR 是面向推荐系统点击率预估模型的 GPU 训练工具以及参考实现。其单 V100 性能可以达到 TF 单台 CPU 服务器的 47 倍。目前已经开源 v2.0 包含了多机多卡训练,混合精度训练,GPU Hashtable 动态插入等特性。本演讲将针对 CTR 训练,通过 HugeCTR 介绍其中的优化方法和关键技术。 ...Read More
Abstract:
HugeCTR 是面向推荐系统点击率预估模型的 GPU 训练工具以及参考实现。其单 V100 性能可以达到 TF 单台 CPU 服务器的 47 倍。目前已经开源 v2.0 包含了多机多卡训练,混合精度训练,GPU Hashtable 动态插入等特性。本演讲将针对 CTR 训练,通过 HugeCTR 介绍其中的优化方法和关键技术。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9794
Streaming:
Download:
Share:
 
Abstract:
5G 将使电信运营商和客户能够将人工智能部署到边缘,从而带来新的商业机会和商业模式。NVIDIA 将带您掌握如何在 5G 和物联网的边缘部署现代人工智能应用,了解 NVIDIA 的 NGC 容器的云本地容器部署,使您的客户的 AI 工作负载更好的结合他们的业务。演讲内容将涵盖零售、制造和医疗保健领域的几个前沿客户部署案例。 ...Read More
Abstract:
5G 将使电信运营商和客户能够将人工智能部署到边缘,从而带来新的商业机会和商业模式。NVIDIA 将带您掌握如何在 5G 和物联网的边缘部署现代人工智能应用,了解 NVIDIA 的 NGC 容器的云本地容器部署,使您的客户的 AI 工作负载更好的结合他们的业务。演讲内容将涵盖零售、制造和医疗保健领域的几个前沿客户部署案例。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9375
Streaming:
Download:
Share:
 
Abstract:
标准深度学习算法基于不使用任何领域知识或约束的功能拟合方法。 这有几个缺点:高样本复杂性,并且缺乏鲁棒性和泛化性,尤其是在领域或任务转移下。 我将展示几种注入结构和领域知识以克服这些限制的方法,即张量,图形,符号规则,物理定律和模拟。 标准的深度学习算法基于不使用任何领域知识或约束的功能拟合方法。 这使其不适用于数据量有限或需要安全性或稳定性保证的应用程序,例如机器人技术。 通过将结构和物理注入到深度学习算法中,我们可以克服这些限制。 有几种方法可以做到这一点。 例如,我们使用张量神经网络对多维数据和高阶相关性进行编码。 我们将符号表达式与数值数据相结合,以学习功能域并获得强大的概括性。 我们将基线控制器与学习到的残余动力学相结合,以改善四旋翼无人机的着陆。 这些实例表明,将结构构建到 ML 算法中可以带来可观的收益。 ...Read More
Abstract:
标准深度学习算法基于不使用任何领域知识或约束的功能拟合方法。 这有几个缺点:高样本复杂性,并且缺乏鲁棒性和泛化性,尤其是在领域或任务转移下。 我将展示几种注入结构和领域知识以克服这些限制的方法,即张量,图形,符号规则,物理定律和模拟。 标准的深度学习算法基于不使用任何领域知识或约束的功能拟合方法。 这使其不适用于数据量有限或需要安全性或稳定性保证的应用程序,例如机器人技术。 通过将结构和物理注入到深度学习算法中,我们可以克服这些限制。 有几种方法可以做到这一点。 例如,我们使用张量神经网络对多维数据和高阶相关性进行编码。 我们将符号表达式与数值数据相结合,以学习功能域并获得强大的概括性。 我们将基线控制器与学习到的残余动力学相结合,以改善四旋翼无人机的着陆。 这些实例表明,将结构构建到 ML 算法中可以带来可观的收益。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9402
Download:
Share:
 
Abstract:
以深度学习为代表的人工智能技术在图像、语音、文本分析等诸多领域都取得了突破性的进展,但是其存在的安全风险往往被人忽视。研究发现,许多在数据集上表现良好的算法非常容易被人眼不可见的对抗样本所欺骗,导致 AI 系统判断失准,给深度学习算法的应用和部署带来了极大的安全隐患。本报告将针对目前深度学习对抗安全中存在的问题,介绍深度学习的对抗攻击和鲁棒防御的最新研究进展及相关应用,并将简要介绍清华大学研发的对抗攻防算法平台,阐述对抗攻防对深度学习模型的鲁棒性和安全性研究的重要意义。 ...Read More
Abstract:
以深度学习为代表的人工智能技术在图像、语音、文本分析等诸多领域都取得了突破性的进展,但是其存在的安全风险往往被人忽视。研究发现,许多在数据集上表现良好的算法非常容易被人眼不可见的对抗样本所欺骗,导致 AI 系统判断失准,给深度学习算法的应用和部署带来了极大的安全隐患。本报告将针对目前深度学习对抗安全中存在的问题,介绍深度学习的对抗攻击和鲁棒防御的最新研究进展及相关应用,并将简要介绍清华大学研发的对抗攻防算法平台,阐述对抗攻防对深度学习模型的鲁棒性和安全性研究的重要意义。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9249
Streaming:
Download:
Share:
 
Abstract:
本次演讲将聚焦 “ABCDEFGH”(人工智能、区块链、云计算、大数据、边缘计算、联邦学习、图计算、高性能计算)为代表的全面智能化技术,帮助参会者了解大数据、AI 时代,在实现智能化转型的道路上,金融行业如何通过核心 AI 技术来解决海量数据处理、技术人才短缺和高昂计算成本带来的挑战。 近几年来数字经济蓬勃发展,以 “ABCDEFGH”(指:人工智能、区块链、云计算、大数据、边缘计算、联邦学习、图计算、高性能计算)为代表的全面智能化技术,正推动传统生产要素全面转向智能化生产要素,助力产业链加速向跨界融合、融通发展、共享共赢的生态圈演进,最终推动数字经济迈向智能经济。此次报告将聚焦以 “ABCDEFG” 为主题的行业实践案例,深入探究人工智能前沿科技与应用。 ...Read More
Abstract:
本次演讲将聚焦 “ABCDEFGH”(人工智能、区块链、云计算、大数据、边缘计算、联邦学习、图计算、高性能计算)为代表的全面智能化技术,帮助参会者了解大数据、AI 时代,在实现智能化转型的道路上,金融行业如何通过核心 AI 技术来解决海量数据处理、技术人才短缺和高昂计算成本带来的挑战。 近几年来数字经济蓬勃发展,以 “ABCDEFGH”(指:人工智能、区块链、云计算、大数据、边缘计算、联邦学习、图计算、高性能计算)为代表的全面智能化技术,正推动传统生产要素全面转向智能化生产要素,助力产业链加速向跨界融合、融通发展、共享共赢的生态圈演进,最终推动数字经济迈向智能经济。此次报告将聚焦以 “ABCDEFG” 为主题的行业实践案例,深入探究人工智能前沿科技与应用。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9341
Share:
 
Abstract:
本演讲介绍了,如何通过平台方案支撑金融领域的计算机视觉需求,以及如何通过 GPU 的训练和预测优化获得性能提升。内容如下:第一节,通过示例,直观感受金融图像场景特性和挑战;第二节,首先介绍平台算法方案,包括分类,检测,ocr,以及视觉反欺诈;然后介绍平台整体架构方案,包含主动学习,样本增强,迁移学习,AutoML,端到端评测,以及在线和离线预测等;还介绍了支持多模型预测,dynamic batch,以及 tensorrt 引擎的在线预测框架。最后重点介绍了GPU 训练和预测优化方案和成果,包括基于 nccl2 和 gpu direct rdma 的hierarchical allreduce 的多机多卡训练,可以在 v100 的 8 卡集群接近线性加速比,自动混合精度训练,tensorrt 的多种优化手段案例,以及mps吞吐优化尝试等;第三节,平台的业务价值,包含开发周期,人力成本,效果,以及资损减少等。 ...Read More
Abstract:
本演讲介绍了,如何通过平台方案支撑金融领域的计算机视觉需求,以及如何通过 GPU 的训练和预测优化获得性能提升。内容如下:第一节,通过示例,直观感受金融图像场景特性和挑战;第二节,首先介绍平台算法方案,包括分类,检测,ocr,以及视觉反欺诈;然后介绍平台整体架构方案,包含主动学习,样本增强,迁移学习,AutoML,端到端评测,以及在线和离线预测等;还介绍了支持多模型预测,dynamic batch,以及 tensorrt 引擎的在线预测框架。最后重点介绍了GPU 训练和预测优化方案和成果,包括基于 nccl2 和 gpu direct rdma 的hierarchical allreduce 的多机多卡训练,可以在 v100 的 8 卡集群接近线性加速比,自动混合精度训练,tensorrt 的多种优化手段案例,以及mps吞吐优化尝试等;第三节,平台的业务价值,包含开发周期,人力成本,效果,以及资损减少等。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9622
Streaming:
Download:
Share:
 
Abstract:
当前金融领域广泛使用对话型机器人解决业务场景需求,复杂应用往往涉及大数据、深度学习、自然语言理解等技术支持。GPU 硬件开发商依托大生态,可以为其他关联技术及辐射行业产生巨大影响。例如竹间在更新 GPU 之后,文字信息、语音及图像处理有了强大驱动力,计算时间明显缩短,机器人训练之后上线服务实时响应更快。 在计算力、模型架构足够支持亿级用户的情况下,未来银行保险行业需要可以覆盖全场景的全双工对话型客服机器人,涵盖智能客服、智能外呼、坐席辅助、智能质检各大领域,包括诸多子功能,支持从售前、售中、售后、客户关系维护到业务洞察给客户提供全面帮助。将分享金融标杆客户应用案例。 ...Read More
Abstract:
当前金融领域广泛使用对话型机器人解决业务场景需求,复杂应用往往涉及大数据、深度学习、自然语言理解等技术支持。GPU 硬件开发商依托大生态,可以为其他关联技术及辐射行业产生巨大影响。例如竹间在更新 GPU 之后,文字信息、语音及图像处理有了强大驱动力,计算时间明显缩短,机器人训练之后上线服务实时响应更快。 在计算力、模型架构足够支持亿级用户的情况下,未来银行保险行业需要可以覆盖全场景的全双工对话型客服机器人,涵盖智能客服、智能外呼、坐席辅助、智能质检各大领域,包括诸多子功能,支持从售前、售中、售后、客户关系维护到业务洞察给客户提供全面帮助。将分享金融标杆客户应用案例。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9553
Download:
Share:
 
Abstract:
联邦学习是基于隐私保护的机器学习方法。为了保证数据安全,联邦学习模型训练中需要进行同态计算和密文传输, 对算力和网络均有苛刻的需求,微众银行及其合作伙伴基于 GPU 异构计算和 GRDMA 做了多方探索。 同态计算是指数据在密文状态进行计算,密文长达 2048 位或更长,计算也不是单纯的加法、乘法,而是基于大数的模幂、模乘,相比常规运算慢 1-4个数量级。考虑到 GPU 具有相当大的并行能力,我们在多个数据甚至单个数据级进行并行计算,相对于 CPU 性能提升超过 6 倍。 密文传输是指加密数据通过网络在联邦学习的不同参与方之间进行同步。面对海量加密数据,低效的网络通信将严重制约训练效率。为了解决这一问题,我们使用 RDMA 网络来提升密文传输效率,并通过 GPUDirect RDMA 技术使得 GPU 做完加密计算后能够直接进行密文传输。由于极大地优化了密文传输的效率,我们的方法对比 TCP 最高有超过 75% 的整体训练效率提升。 ...Read More
Abstract:
联邦学习是基于隐私保护的机器学习方法。为了保证数据安全,联邦学习模型训练中需要进行同态计算和密文传输, 对算力和网络均有苛刻的需求,微众银行及其合作伙伴基于 GPU 异构计算和 GRDMA 做了多方探索。 同态计算是指数据在密文状态进行计算,密文长达 2048 位或更长,计算也不是单纯的加法、乘法,而是基于大数的模幂、模乘,相比常规运算慢 1-4个数量级。考虑到 GPU 具有相当大的并行能力,我们在多个数据甚至单个数据级进行并行计算,相对于 CPU 性能提升超过 6 倍。 密文传输是指加密数据通过网络在联邦学习的不同参与方之间进行同步。面对海量加密数据,低效的网络通信将严重制约训练效率。为了解决这一问题,我们使用 RDMA 网络来提升密文传输效率,并通过 GPUDirect RDMA 技术使得 GPU 做完加密计算后能够直接进行密文传输。由于极大地优化了密文传输的效率,我们的方法对比 TCP 最高有超过 75% 的整体训练效率提升。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9462
Streaming:
Download:
Share:
 
Abstract:
产业智能化是大势所趋,金融行业应用场景多样、数据化和信息化水平相对较高,是最适合 AI 应用落地的行业。 AI 技术中台作为 AI 应用落地的基础设施载体,是 AI 应用实现数据闭环、持续发挥业务价值的底座,也是应对金融 AI 应用规模化的利器。 企业 AI 技术中台,由算力资源、基础计算和存储系统、机器学习/深度学习框架、模型仓库系统、应用驱动等多层能力构成,具备丰富的 AI 储备和完善的企业服务集成能力,支持通过灵活的解决方案敏捷支持金融 AI 模型开发和场景落地。 AI 技术中台一体机方案,软硬结合,深挖 GPU 算力潜力、提升性价比,是 AI 落地最好的载体之一。 ...Read More
Abstract:
产业智能化是大势所趋,金融行业应用场景多样、数据化和信息化水平相对较高,是最适合 AI 应用落地的行业。 AI 技术中台作为 AI 应用落地的基础设施载体,是 AI 应用实现数据闭环、持续发挥业务价值的底座,也是应对金融 AI 应用规模化的利器。 企业 AI 技术中台,由算力资源、基础计算和存储系统、机器学习/深度学习框架、模型仓库系统、应用驱动等多层能力构成,具备丰富的 AI 储备和完善的企业服务集成能力,支持通过灵活的解决方案敏捷支持金融 AI 模型开发和场景落地。 AI 技术中台一体机方案,软硬结合,深挖 GPU 算力潜力、提升性价比,是 AI 落地最好的载体之一。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9262
Share:
 
Abstract:
本次演讲将聚焦人工智能为代表的全面智能化技术,帮助参会者了解大数据 +AI 时代,金融行业如何通过核心 AI 技术和自动化技术解决海量数据生产到处理和高昂人工成本带来的挑战。阿博茨科技本次展示的内容中,将会带来数据生产到应用的全线 AI 能力,除了非结构化数据处理平台之外,融合了 AI 技术的新一代 IPA、NLP 搜索 BI 技术,解决了数据从采集到决策的全链条中大量依靠人力处理的脏活累活。 另外,阿博茨 CTO 刘铁峰先生,将首次公开阿博茨以GPU为底层计算平台,如何利用机器学习平台进行数据抽取闭环训练,结合 NLP 与 CV 融合,打造高速的非结构化数据处理平台。特别是在数千万的样本中利用 NVIDIA 的 GPU,训练速度相对 CPU 有 8 倍提升,帮助快速进行模型改进、参数调整。 阿博茨科技一家以人工智能技术为核心的金融科技公司,公司致力于将人工智能技术赋能于金融业,为金融从业者带来效率提升的全方位的技术增强服务。经过与几十家国内外机构合作,阿博茨科技打磨了成熟的 AI+金融的解决方案体系,成为了金融与人工智能之间的黄金纽带,受到了业界的普遍认可,是中国金融科技创新模式的探索者和开拓者。 ...Read More
Abstract:
本次演讲将聚焦人工智能为代表的全面智能化技术,帮助参会者了解大数据 +AI 时代,金融行业如何通过核心 AI 技术和自动化技术解决海量数据生产到处理和高昂人工成本带来的挑战。阿博茨科技本次展示的内容中,将会带来数据生产到应用的全线 AI 能力,除了非结构化数据处理平台之外,融合了 AI 技术的新一代 IPA、NLP 搜索 BI 技术,解决了数据从采集到决策的全链条中大量依靠人力处理的脏活累活。 另外,阿博茨 CTO 刘铁峰先生,将首次公开阿博茨以GPU为底层计算平台,如何利用机器学习平台进行数据抽取闭环训练,结合 NLP 与 CV 融合,打造高速的非结构化数据处理平台。特别是在数千万的样本中利用 NVIDIA 的 GPU,训练速度相对 CPU 有 8 倍提升,帮助快速进行模型改进、参数调整。 阿博茨科技一家以人工智能技术为核心的金融科技公司,公司致力于将人工智能技术赋能于金融业,为金融从业者带来效率提升的全方位的技术增强服务。经过与几十家国内外机构合作,阿博茨科技打磨了成熟的 AI+金融的解决方案体系,成为了金融与人工智能之间的黄金纽带,受到了业界的普遍认可,是中国金融科技创新模式的探索者和开拓者。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9336
Streaming:
Download:
Share:
 
Abstract:
我们演示了量化分析人员如何利用 GPU 加速的Python和 RAPIDS 库来解决一些最紧迫的挑战。利用 GPU 加速的数据帧, 我们可以快速处理大型数据集,大大缩短了研究反馈周期。我们使用开源的 Python 示例演示如何用数据流驱动的计算图来构建复杂的数据科学工作流。我们可以将其序列化为 YAML 配置文件,方便维护和配置。我们通过用 cudf_dask 分布式数据帧,轻松实现数据科学工作流程的分布式运算。在一个端到端的股票交易回测示例中,我们将演示使用 GPU 可实现 20 倍以上的加速。 ...Read More
Abstract:
我们演示了量化分析人员如何利用 GPU 加速的Python和 RAPIDS 库来解决一些最紧迫的挑战。利用 GPU 加速的数据帧, 我们可以快速处理大型数据集,大大缩短了研究反馈周期。我们使用开源的 Python 示例演示如何用数据流驱动的计算图来构建复杂的数据科学工作流。我们可以将其序列化为 YAML 配置文件,方便维护和配置。我们通过用 cudf_dask 分布式数据帧,轻松实现数据科学工作流程的分布式运算。在一个端到端的股票交易回测示例中,我们将演示使用 GPU 可实现 20 倍以上的加速。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN94572
Streaming:
Download:
Share:
 
Abstract:
根据 Gartner 的数据,到 2023 年,40% 的大型企业将使用机器学习,从 2018 年到 2023 年,人工智能使用的计算资源将增加5倍。无论是汽车制造商使用模拟和计算技术来创建最省油和时尚的设计,或研究人员分析基因的功能更快地发展医学治疗,或环保人士预测自然灾害损失降到最低和速度响应时间,使用人工智能已经成为普遍的跨企业,让产品更好,甚至挽救生命。了解 NVIDIA Virtual ComputeServer (vComputeServer)软件如何使企业能够以低成本有效地虚拟化 GPU 并加速计算密集型服务器工作负载,包括 AI、数据科学和 HPC。 ...Read More
Abstract:
根据 Gartner 的数据,到 2023 年,40% 的大型企业将使用机器学习,从 2018 年到 2023 年,人工智能使用的计算资源将增加5倍。无论是汽车制造商使用模拟和计算技术来创建最省油和时尚的设计,或研究人员分析基因的功能更快地发展医学治疗,或环保人士预测自然灾害损失降到最低和速度响应时间,使用人工智能已经成为普遍的跨企业,让产品更好,甚至挽救生命。了解 NVIDIA Virtual ComputeServer (vComputeServer)软件如何使企业能够以低成本有效地虚拟化 GPU 并加速计算密集型服务器工作负载,包括 AI、数据科学和 HPC。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9388
Streaming:
Download:
Share:
 
Abstract:
从 GPU 上云的几种热门技术引申到虚拟 GPU 技术。并详细列举虚拟 GPU 在分片共享 GPU 上面的资源,性能,兼容性,价格等优势。同时举例虚拟 GPU 的典型应用场景:比如云游戏,AI 学习教学,小规模推理,远程桌面等等。 ...Read More
Abstract:
从 GPU 上云的几种热门技术引申到虚拟 GPU 技术。并详细列举虚拟 GPU 在分片共享 GPU 上面的资源,性能,兼容性,价格等优势。同时举例虚拟 GPU 的典型应用场景:比如云游戏,AI 学习教学,小规模推理,远程桌面等等。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9241
Share:
 
Abstract:
怎么样构建稳定高效可依赖的计算服务呢?这里面涉及软件、硬件,软件又涉及驱动、OS、计算框架、通信框架、应用后台等一系列能力的建设,硬件涉及 CPU/GPU/ASIC 的构建和管理,及其上的虚拟化、容器化服务。本文将概论星辰.机智计算服务背后的技术和能力。 ...Read More
Abstract:
怎么样构建稳定高效可依赖的计算服务呢?这里面涉及软件、硬件,软件又涉及驱动、OS、计算框架、通信框架、应用后台等一系列能力的建设,硬件涉及 CPU/GPU/ASIC 的构建和管理,及其上的虚拟化、容器化服务。本文将概论星辰.机智计算服务背后的技术和能力。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9181
Streaming:
Download:
Share:
 
Abstract:
面对即将到来的 5G 时代,网络速率大幅提升,基于音视觉的多模态人机交互被看作下一代主要的人机交互方式,本报告将分享搜狗在多模态人机交互-搜狗知音系统上的研究和落地进展。 ...Read More
Abstract:
面对即将到来的 5G 时代,网络速率大幅提升,基于音视觉的多模态人机交互被看作下一代主要的人机交互方式,本报告将分享搜狗在多模态人机交互-搜狗知音系统上的研究和落地进展。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9572
Streaming:
Download:
Share:
 
Abstract:
美团机器学习平台搭建了基于 Hadoop yarn 的 GPU 在线服务集群。GPU 集群支持了集团内部图像,NLP,CTR 等多种场景的 GPU 在线服务。集群中的服务以 TensorFlow Serving 为基础,提供了支持多框架,多硬件的一体化解决方案。此次分享主要包括集群搭建,TensorFlow Serving 架构,多框架支持,多场景支持等内容。 ...Read More
Abstract:
美团机器学习平台搭建了基于 Hadoop yarn 的 GPU 在线服务集群。GPU 集群支持了集团内部图像,NLP,CTR 等多种场景的 GPU 在线服务。集群中的服务以 TensorFlow Serving 为基础,提供了支持多框架,多硬件的一体化解决方案。此次分享主要包括集群搭建,TensorFlow Serving 架构,多框架支持,多场景支持等内容。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9830
Share:
 
Abstract:
基于神经网络的推荐模型已经普遍应用于各种电商和社交媒体网站的推荐系统中,常见的推荐系统推理采用 CPU 进行,但是当推荐系统需要对越来越多的商品进行排序时,CPU 已经无法满足推荐系统的实时性和吞吐率。本文基于 T4 提供的算力,对推荐系统的推理性能进行了优化,包括 Node Placement、FP16 量化以及图转换三种优化方式,将推荐系统的推理性能提高了 3.9 倍。 ...Read More
Abstract:
基于神经网络的推荐模型已经普遍应用于各种电商和社交媒体网站的推荐系统中,常见的推荐系统推理采用 CPU 进行,但是当推荐系统需要对越来越多的商品进行排序时,CPU 已经无法满足推荐系统的实时性和吞吐率。本文基于 T4 提供的算力,对推荐系统的推理性能进行了优化,包括 Node Placement、FP16 量化以及图转换三种优化方式,将推荐系统的推理性能提高了 3.9 倍。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9608
Streaming:
Download:
Share:
 
Abstract:
Tencent START 云游戏,是腾讯面向未来的跨终端游戏平台,目标是让用户随时随地玩大型游戏。本演讲介绍结合 TENCENT 与 NVIDIA 双方优势,共同打造 TENCENT START 云游戏平台和构建未来超大型游戏渲染集群系统,重点探讨 TENCENT START 在 NVIDIA GPU 上,是如何给玩家带来更好游戏体验的: 1. 如何在 NVIDIA GP 上实现多游戏实例高清渲染 2. 如何利用 NVIDIA GPU 实现高效编码 3. 如何实现负载均衡和低延时传输 4. 如何实现边缘 GPU 计算等 ...Read More
Abstract:
Tencent START 云游戏,是腾讯面向未来的跨终端游戏平台,目标是让用户随时随地玩大型游戏。本演讲介绍结合 TENCENT 与 NVIDIA 双方优势,共同打造 TENCENT START 云游戏平台和构建未来超大型游戏渲染集群系统,重点探讨 TENCENT START 在 NVIDIA GPU 上,是如何给玩家带来更好游戏体验的: 1. 如何在 NVIDIA GP 上实现多游戏实例高清渲染 2. 如何利用 NVIDIA GPU 实现高效编码 3. 如何实现负载均衡和低延时传输 4. 如何实现边缘 GPU 计算等  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9756
Share:
 
Abstract:
百度凤巢(搜索广告)将 CTR 模型训练从数百个 CPU 节点迁移到 HGX-2,在相同训练速度下将硬件成本降低一个数量级,或者在相同硬件成本下将训练速度提高数倍 。这项工作基于最先进的异构硬件、高度集成的 AI 超级计算机,以及硬件/软件的紧密协作。 如果您正在使用深度学习来改善广告或推荐系统,或者您正在克服用于深度学习的高维稀疏数据的挑战,欢迎参加我们的分享! ...Read More
Abstract:
百度凤巢(搜索广告)将 CTR 模型训练从数百个 CPU 节点迁移到 HGX-2,在相同训练速度下将硬件成本降低一个数量级,或者在相同硬件成本下将训练速度提高数倍 。这项工作基于最先进的异构硬件、高度集成的 AI 超级计算机,以及硬件/软件的紧密协作。 如果您正在使用深度学习来改善广告或推荐系统,或者您正在克服用于深度学习的高维稀疏数据的挑战,欢迎参加我们的分享!  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9472
Share:
 
Abstract:
飞天 AI 加速解决方案实现了业界首次统一支持了 Tensorflow, PyTorch, MXNET, Caffe 的性能加速框架,实现了通过统一加速模式,支持大部分客户 AI 训练和推理场景性能翻倍提升的效果,大幅提升 AI 场景的计算效率和 GPU 利用率。介绍飞天 AI 加速工具和异构计算服务,介绍 FastGPU 和基于 K8S 的 AI 解决方案,讲解飞天 AI 加速技术架构以及性能优化的方法,介绍飞天 AI 加速工具对于 AI 训练和推理性能提升的客户案例。 ...Read More
Abstract:
飞天 AI 加速解决方案实现了业界首次统一支持了 Tensorflow, PyTorch, MXNET, Caffe 的性能加速框架,实现了通过统一加速模式,支持大部分客户 AI 训练和推理场景性能翻倍提升的效果,大幅提升 AI 场景的计算效率和 GPU 利用率。介绍飞天 AI 加速工具和异构计算服务,介绍 FastGPU 和基于 K8S 的 AI 解决方案,讲解飞天 AI 加速技术架构以及性能优化的方法,介绍飞天 AI 加速工具对于 AI 训练和推理性能提升的客户案例。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9488
Share:
 
Abstract:
AI 普惠化的趋势已经形成,未来 2-5 年 AI 将无处不在,而通过云计算等方式,今后 10 年 AI 技术将真正惠及每一个人。AI PaaS 提供 AI 建模工具、APIs 和模型训练平台等服务,已经成为当今对商务影响最大的技术服务。 本演讲将重点涵盖以下内容: • 京东云 AI 开放平台的侧重点 • 购买服务成为 AI 开放平台趋势性商业模式 • 开放平台未来要迎接的挑战 ...Read More
Abstract:
AI 普惠化的趋势已经形成,未来 2-5 年 AI 将无处不在,而通过云计算等方式,今后 10 年 AI 技术将真正惠及每一个人。AI PaaS 提供 AI 建模工具、APIs 和模型训练平台等服务,已经成为当今对商务影响最大的技术服务。 本演讲将重点涵盖以下内容: • 京东云 AI 开放平台的侧重点 • 购买服务成为 AI 开放平台趋势性商业模式 • 开放平台未来要迎接的挑战  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9346
Streaming:
Download:
Share:
 
Abstract:
欢迎来和 Mellanox 分享如何构建先进的以数据为中心的 AI 系统。Mellanox 公司是高性能、易扩展和低延迟的网络设备提供商,包括 InfiniBand 和 Ethernet 网络产品。我们会介绍分布式机器学习的关键技术以及关键需求,以及最新的面向大规模分布式机器学习系统的网络技术 - 网络计算技术,网络计算技术将会是解决超大规模 HPC 和 AI 扩展瓶颈的重要途径。 ...Read More
Abstract:
欢迎来和 Mellanox 分享如何构建先进的以数据为中心的 AI 系统。Mellanox 公司是高性能、易扩展和低延迟的网络设备提供商,包括 InfiniBand 和 Ethernet 网络产品。我们会介绍分布式机器学习的关键技术以及关键需求,以及最新的面向大规模分布式机器学习系统的网络技术 - 网络计算技术,网络计算技术将会是解决超大规模 HPC 和 AI 扩展瓶颈的重要途径。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9496
Streaming:
Download:
Share:
 
Abstract:
人工智能 (AI) 和深度学习 (DL) 可以帮助企业检测欺诈行为、加强与客户的关系、优化供应链、交付创新产品和服务,从而在竞争日益激烈的市场中占据一席之地。由 NVIDIA DGX 超级计算机和 NetApp 云互联全闪存存储提供动力支持的业已验证的 NetApp ONTAP AI 架构可简化、加速和集成数据平台,帮助您充分实现人工智能和深度学习的优势。利用横跨边缘到核心再到云的 Data Fabric,可以可靠地简化数据流,加速训练和推理。 ...Read More
Abstract:
人工智能 (AI) 和深度学习 (DL) 可以帮助企业检测欺诈行为、加强与客户的关系、优化供应链、交付创新产品和服务,从而在竞争日益激烈的市场中占据一席之地。由 NVIDIA DGX 超级计算机和 NetApp 云互联全闪存存储提供动力支持的业已验证的 NetApp ONTAP AI 架构可简化、加速和集成数据平台,帮助您充分实现人工智能和深度学习的优势。利用横跨边缘到核心再到云的 Data Fabric,可以可靠地简化数据流,加速训练和推理。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9569
Streaming:
Download:
Share:
 
Abstract:
人工智能的技术在医疗影像的诊断中取得了一定的成果。与此同时,AI 在医疗影像的应用也遇到了一些困难和挑战。为了能够使医疗 AI 应用研发更便捷和迅速,NVIDIA 发布了 Clara 平台。平台集成了多个业内领先的模型和 NVIDIA 的最新技术。 与此同时,医疗图像 AI 也在影像协会的工作中收到越来越多的关注。研究和使用的经验也日渐丰富。本演讲介绍了 NVIDIA Clara 平台以及 NVIDIA 最新发布的联邦学习。通过一些研究案例,分享了 AI 在医疗影像诊断中起到的作用和未来发展的方向, ...Read More
Abstract:
人工智能的技术在医疗影像的诊断中取得了一定的成果。与此同时,AI 在医疗影像的应用也遇到了一些困难和挑战。为了能够使医疗 AI 应用研发更便捷和迅速,NVIDIA 发布了 Clara 平台。平台集成了多个业内领先的模型和 NVIDIA 的最新技术。 与此同时,医疗图像 AI 也在影像协会的工作中收到越来越多的关注。研究和使用的经验也日渐丰富。本演讲介绍了 NVIDIA Clara 平台以及 NVIDIA 最新发布的联邦学习。通过一些研究案例,分享了 AI 在医疗影像诊断中起到的作用和未来发展的方向,  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9827
Streaming:
Download:
Share:
 
Abstract:
赛飞是平安集团研发的搭建在大规模 GPU 集群之上的分布式 AI 算法平台,为数据科学家提供自研深度学习框架 SFE、AutoML/NAS、Active Learning 标注、GAN 样本扩增/跨域自适应、CV/OCR/NLP 算法套件、分布式及混合精度加速、模型压缩和高性能推断等工具和服务。 已支持多产品落地,如:全球首款 OCT 眼底 AI 筛查系统,据复旦附属眼耳鼻喉科医院,上海一院、上海十院共同完成的临床前试验结果显示,该系统在图像质控、病灶检测、急迫性判断 3 项辅助医疗任务中准确率为 99.2%、98.6%、96.7%。还有支持 1500+ 疾病的平安智慧医疗智能辅助诊疗系统,在甘肃、重庆、河南等 10 个省 28 个城市的县医院等基层医疗机构上线,每周提供超过 30 万次的诊断和治疗推荐服务。 ...Read More
Abstract:
赛飞是平安集团研发的搭建在大规模 GPU 集群之上的分布式 AI 算法平台,为数据科学家提供自研深度学习框架 SFE、AutoML/NAS、Active Learning 标注、GAN 样本扩增/跨域自适应、CV/OCR/NLP 算法套件、分布式及混合精度加速、模型压缩和高性能推断等工具和服务。 已支持多产品落地,如:全球首款 OCT 眼底 AI 筛查系统,据复旦附属眼耳鼻喉科医院,上海一院、上海十院共同完成的临床前试验结果显示,该系统在图像质控、病灶检测、急迫性判断 3 项辅助医疗任务中准确率为 99.2%、98.6%、96.7%。还有支持 1500+ 疾病的平安智慧医疗智能辅助诊疗系统,在甘肃、重庆、河南等 10 个省 28 个城市的县医院等基层医疗机构上线,每周提供超过 30 万次的诊断和治疗推荐服务。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9623
Share:
 
Abstract:
本次的主题将让听众详细了解数坤如何将大规模 GPU 集群和深度学习应用到医疗影像所需的心脑血管精确分割中,并基于此开发出全球唯一、贯穿影像 AI 后处理和诊断的心脑血管 AI 产品。演讲将围绕基于增强 CT 造影的心脑血管分割展开:1、CTA 影像血管精确分割技术难度极高,在数坤产品面世之前,全球尚无已公开的产品可以在无人工干预的情况下达到临床实用的标准;2、详细说明针对这些问题,我们如何利用大规模 GPU 集群,在较短时间内对深度神经网络进行构建、优化和创新,并同时完成医疗影像数据的快速标注、回流。这些大数据在进行并行训练和自动/半自动模型调优工作,再将算法的研究成果无缝接入产品的部署和发布。演讲首次披露数坤如何进行端到端的算法难点研究到工 业级产品应用的核心过程;3、简要描述基于该技术和 GPU 应用的数坤冠脉 CTA 辅助诊断 AI 产品在全国 180 多家三甲医院的应用情况。 ...Read More
Abstract:
本次的主题将让听众详细了解数坤如何将大规模 GPU 集群和深度学习应用到医疗影像所需的心脑血管精确分割中,并基于此开发出全球唯一、贯穿影像 AI 后处理和诊断的心脑血管 AI 产品。演讲将围绕基于增强 CT 造影的心脑血管分割展开:1、CTA 影像血管精确分割技术难度极高,在数坤产品面世之前,全球尚无已公开的产品可以在无人工干预的情况下达到临床实用的标准;2、详细说明针对这些问题,我们如何利用大规模 GPU 集群,在较短时间内对深度神经网络进行构建、优化和创新,并同时完成医疗影像数据的快速标注、回流。这些大数据在进行并行训练和自动/半自动模型调优工作,再将算法的研究成果无缝接入产品的部署和发布。演讲首次披露数坤如何进行端到端的算法难点研究到工 业级产品应用的核心过程;3、简要描述基于该技术和 GPU 应用的数坤冠脉 CTA 辅助诊断 AI 产品在全国 180 多家三甲医院的应用情况。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9425
Streaming:
Download:
Share:
 
Abstract:
基因测序技术的快速发展使得测序的成本大幅度降低,同时在全球范围内产生了大量的数据。通过结合实验室技术的创新,测序技术能够实现基因组,转录组,表观组这样复杂数据模态的分析。为解决基因测序和分析中不断增长的数据量和复杂性,NVIDIA 推出了采用 GPU 加速计算和深度学习技术的 Clara Genomics。本演讲介绍 NVIDIA 对一系列测序技术进行加速和改进的研发工作。 ...Read More
Abstract:
基因测序技术的快速发展使得测序的成本大幅度降低,同时在全球范围内产生了大量的数据。通过结合实验室技术的创新,测序技术能够实现基因组,转录组,表观组这样复杂数据模态的分析。为解决基因测序和分析中不断增长的数据量和复杂性,NVIDIA 推出了采用 GPU 加速计算和深度学习技术的 Clara Genomics。本演讲介绍 NVIDIA 对一系列测序技术进行加速和改进的研发工作。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9976
Download:
Share:
 
Abstract:
生命科学领域的两大支柱:表型组和基因组,是度量生命的最重要的手段和方法。人工智能已经在此领域的应用以惊人的速度发展壮大。AI 在表型组领域的应用,主要体现在基于图像的识别,包括人体外貌特征,显微镜检测,组织和肿瘤病理图像。如果说 AI 在表型组领域的应用主要归功于 AI 在通用图像领域成功经验的复制的话,AI 在基因组领域的应用更惹人注目。Google 的 AI 实验室发布的DeepVariant将基因组变异转换为图像识别问题,赢得了美国 FDA 精准医学挑战赛。AI,特别是深度学习在基因组研究上一战成名。Oxford Nanopore 是第三代测序领域的翘楚,其通过 AI,将电信号转换为 DNA 序列。北京希望组致力于将 Oxford Nanopore 和 GPU 计算以及人工智能和大数据应用于临床医学和农业精准育种领域,并且将和 NVIDIA 深度合作,一起推动 AI 在基因组领域的应用。 ...Read More
Abstract:
生命科学领域的两大支柱:表型组和基因组,是度量生命的最重要的手段和方法。人工智能已经在此领域的应用以惊人的速度发展壮大。AI 在表型组领域的应用,主要体现在基于图像的识别,包括人体外貌特征,显微镜检测,组织和肿瘤病理图像。如果说 AI 在表型组领域的应用主要归功于 AI 在通用图像领域成功经验的复制的话,AI 在基因组领域的应用更惹人注目。Google 的 AI 实验室发布的DeepVariant将基因组变异转换为图像识别问题,赢得了美国 FDA 精准医学挑战赛。AI,特别是深度学习在基因组研究上一战成名。Oxford Nanopore 是第三代测序领域的翘楚,其通过 AI,将电信号转换为 DNA 序列。北京希望组致力于将 Oxford Nanopore 和 GPU 计算以及人工智能和大数据应用于临床医学和农业精准育种领域,并且将和 NVIDIA 深度合作,一起推动 AI 在基因组领域的应用。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9587
Streaming:
Download:
Share:
 
Abstract:
TensorRT 是 NVIDIA 推出的用于加速深度学习推理的开发工具。现已有大量的线上模型在它上面运行,实现了相比于原生框架最高近 10 倍的加速比,极大地提高了 GPU 的利用效率,降低了 GPU 的使用成本。 不过,由于许多模型无法被原生框架彻底地转换到 TensorRT 上,需要手工搭建,所涉及的学习和时间成本让一些开发者望而却步,遗憾地失去了加速程序的机会。 鉴于此,本报告试图通过一个典型的深度学习模型作为例子,深入讲解利用 TensorRT 自由搭建各种模型的实用技巧。在理解本报告的基础上,开发者可以快速上手 TensorRT,独立地利用它加速自己的模型,获得丰厚的收益。 本报告的预备知识为对深度学习和编程语言的基本了解,难度较低,希望能给深度学习开发者带来帮助。 ...Read More
Abstract:
TensorRT 是 NVIDIA 推出的用于加速深度学习推理的开发工具。现已有大量的线上模型在它上面运行,实现了相比于原生框架最高近 10 倍的加速比,极大地提高了 GPU 的利用效率,降低了 GPU 的使用成本。 不过,由于许多模型无法被原生框架彻底地转换到 TensorRT 上,需要手工搭建,所涉及的学习和时间成本让一些开发者望而却步,遗憾地失去了加速程序的机会。 鉴于此,本报告试图通过一个典型的深度学习模型作为例子,深入讲解利用 TensorRT 自由搭建各种模型的实用技巧。在理解本报告的基础上,开发者可以快速上手 TensorRT,独立地利用它加速自己的模型,获得丰厚的收益。 本报告的预备知识为对深度学习和编程语言的基本了解,难度较低,希望能给深度学习开发者带来帮助。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9577
Streaming:
Download:
Share:
 
Abstract:
本演讲基于OCR文本检测模型EAST,介绍如何使用NVIDIA TF-TRT在TensorFlow框架下进行深度学习推理加速,包括TF-TRT的基本流程和优化策略、如何对已训练好的TensorFlow模型进行优化并部署在推理过程中以及低精度优化(FP16和INT8)的使用方法。通过本次演讲,参会者能直观了解到TF-TRT这项工具是如何帮助TensorFlow框架下的深度学习模型进行加速推理,以及通过改动很少的代码就能得到较大的性能提升。 ...Read More
Abstract:
本演讲基于OCR文本检测模型EAST,介绍如何使用NVIDIA TF-TRT在TensorFlow框架下进行深度学习推理加速,包括TF-TRT的基本流程和优化策略、如何对已训练好的TensorFlow模型进行优化并部署在推理过程中以及低精度优化(FP16和INT8)的使用方法。通过本次演讲,参会者能直观了解到TF-TRT这项工具是如何帮助TensorFlow框架下的深度学习模型进行加速推理,以及通过改动很少的代码就能得到较大的性能提升。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9456
Streaming:
Download:
Share:
 
Abstract:
本演讲将向听众介绍以下内容: 1)基于DNN的CTR在线预估模型介绍 2)CTR在线预估模型计算性能指标分析 3)CTR在线预估模型常见的计算性能问题和优化方法 4)使用TensorRT加速CTR在线预估模型 ...Read More
Abstract:
本演讲将向听众介绍以下内容: 1)基于DNN的CTR在线预估模型介绍 2)CTR在线预估模型计算性能指标分析 3)CTR在线预估模型常见的计算性能问题和优化方法 4)使用TensorRT加速CTR在线预估模型  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9862
Streaming:
Download:
Share:
 
Abstract:
TensorRT Inference Server简称TRTIS,是NVIDIA开源的轻量级GPU在线服务部署框架,该Talk将会深入介绍TRTIS的丰富特性,比如多模型部署、多深度学习框架支持、多GPU负载均衡、流式服务部署以及GPU服务指标检测等等。并结合Demo演示如何在TRTIS上部署NVIDIA最新推出的BERT推理加速方案,高效部署BERT的在线GPU推理服务。 ...Read More
Abstract:
TensorRT Inference Server简称TRTIS,是NVIDIA开源的轻量级GPU在线服务部署框架,该Talk将会深入介绍TRTIS的丰富特性,比如多模型部署、多深度学习框架支持、多GPU负载均衡、流式服务部署以及GPU服务指标检测等等。并结合Demo演示如何在TRTIS上部署NVIDIA最新推出的BERT推理加速方案,高效部署BERT的在线GPU推理服务。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9506
Streaming:
Download:
Share:
 
Abstract:
语音服务逐渐深入到人类生产生活的各个角落,智能音箱、语音助手的普及打开了我们与计算机交流的新通道。只有语音识别、语音合成、自然语言理解及更多相关技术都达到足够高的水平,高质量的交互闭环才能建立,为生活带来更多便利,创造新的商业机会。本演讲针对近几年出现的端到端语音合成新方法,探索基于 GPU 加速其在线推理速度的解决方案,以促进相关技术的推广普及。 ...Read More
Abstract:
语音服务逐渐深入到人类生产生活的各个角落,智能音箱、语音助手的普及打开了我们与计算机交流的新通道。只有语音识别、语音合成、自然语言理解及更多相关技术都达到足够高的水平,高质量的交互闭环才能建立,为生活带来更多便利,创造新的商业机会。本演讲针对近几年出现的端到端语音合成新方法,探索基于 GPU 加速其在线推理速度的解决方案,以促进相关技术的推广普及。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9916
Streaming:
Download:
Share:
 
Abstract:
我们将在这次演讲中介绍PaddlePaddle中的自动混合精度训练(AMP)。通过几行python代码,它就能够应用混合精度训练神经网络。混合精度训练的优势在于它不仅可以减少显存占用而且还能够充分利用Tensor Core在某些操作上对于FP16数值计算的加速能力。实际上,端到端的混合精度训练在各种模型上可以带来大约2~4倍的加速。本次演讲我们将会简要回顾混合精度训练的理论,最佳实践,然后详细介绍自动混合精度训练(AMP)在PaddlePaddle上的实现以及实验结果。 ...Read More
Abstract:
我们将在这次演讲中介绍PaddlePaddle中的自动混合精度训练(AMP)。通过几行python代码,它就能够应用混合精度训练神经网络。混合精度训练的优势在于它不仅可以减少显存占用而且还能够充分利用Tensor Core在某些操作上对于FP16数值计算的加速能力。实际上,端到端的混合精度训练在各种模型上可以带来大约2~4倍的加速。本次演讲我们将会简要回顾混合精度训练的理论,最佳实践,然后详细介绍自动混合精度训练(AMP)在PaddlePaddle上的实现以及实验结果。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9312
Streaming:
Download:
Share:
 
Abstract:
本演讲旨在为GPU程序的开发者提供一个在某些特定领域(例如RNN)提高应用性能的重要编程思路和方法。本演讲首先解释持久性GPU编程的方法和普通CUDA编程方法之间的区别。之后介绍这种编程方法的意图和优势。最后通过一些实际的案例来讲解实际的性能提升以及持久性GPU编程更高级的优化技巧。 ...Read More
Abstract:
本演讲旨在为GPU程序的开发者提供一个在某些特定领域(例如RNN)提高应用性能的重要编程思路和方法。本演讲首先解释持久性GPU编程的方法和普通CUDA编程方法之间的区别。之后介绍这种编程方法的意图和优势。最后通过一些实际的案例来讲解实际的性能提升以及持久性GPU编程更高级的优化技巧。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9392
Streaming:
Download:
Share:
 
Abstract:
NVIDIA Nsight Systems 是一款系统级的性能分析工具,旨在帮助开发人员有效地优化 GPU 程序,提升系统的整体性能。本报告会介绍 Nsight Systems 的基本特性和基础使用,帮助开发者迅速定位应用程序的瓶颈,提升应用程序的性能。 ...Read More
Abstract:
NVIDIA Nsight Systems 是一款系统级的性能分析工具,旨在帮助开发人员有效地优化 GPU 程序,提升系统的整体性能。本报告会介绍 Nsight Systems 的基本特性和基础使用,帮助开发者迅速定位应用程序的瓶颈,提升应用程序的性能。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9951
Streaming:
Download:
Share:
 
Abstract:
本次分享主要介绍Pascal架构的下的汇编优化方法,以矩阵乘法与卷积为例来介绍,如何在汇编层面提升访存和计算效率,来超越已有矩阵乘法与卷积的实现。 滴滴 AI-智能加速引擎 IFX,旨在提供一个高吞吐,低时延的推理引擎,支持 TensorFlow、PyTorch、Caffe、DarkNet 等主流框架的模型,使用低精度量化、图优化、汇编优化算子等方法提升模型性能。本次介绍 IFX 在滴滴内部的部署和实践分享。 ...Read More
Abstract:
本次分享主要介绍Pascal架构的下的汇编优化方法,以矩阵乘法与卷积为例来介绍,如何在汇编层面提升访存和计算效率,来超越已有矩阵乘法与卷积的实现。 滴滴 AI-智能加速引擎 IFX,旨在提供一个高吞吐,低时延的推理引擎,支持 TensorFlow、PyTorch、Caffe、DarkNet 等主流框架的模型,使用低精度量化、图优化、汇编优化算子等方法提升模型性能。本次介绍 IFX 在滴滴内部的部署和实践分享。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9667
Streaming:
Download:
Share:
 
Abstract:
加速模型训练和预测对深度学习非常重要。典型深度学习加速技术通常依赖来自领域专家的大量手工优化工作。这些工作既费时费力,又单调乏味,从而激发了人们对支持端到端自动优化的深度学习编译器的极大兴趣。在该演讲中,我们展示Woodpecker-DL,一个基于异构体系结构加速深度学习的高效编译器。该编译器基本上由五个部件组成:计算图优化,张量描述的优化图,耦合了软/硬件描述语言和专家优化库的领域定制语言编译器,支持多种硬件的执行引擎,以及支持多种参数化搜索算法(遗传算法和强化学习等)的自动调优框架。我们使用蚂蚁金服支付业务的某真实深度神经网络对Woodpecker-DL和TensorRT进行了性能测评和比对。实验结果展示在同样GPU上,Woodpecker-DL能取得比TensorRT高达两倍的加速比。 ...Read More
Abstract:
加速模型训练和预测对深度学习非常重要。典型深度学习加速技术通常依赖来自领域专家的大量手工优化工作。这些工作既费时费力,又单调乏味,从而激发了人们对支持端到端自动优化的深度学习编译器的极大兴趣。在该演讲中,我们展示Woodpecker-DL,一个基于异构体系结构加速深度学习的高效编译器。该编译器基本上由五个部件组成:计算图优化,张量描述的优化图,耦合了软/硬件描述语言和专家优化库的领域定制语言编译器,支持多种硬件的执行引擎,以及支持多种参数化搜索算法(遗传算法和强化学习等)的自动调优框架。我们使用蚂蚁金服支付业务的某真实深度神经网络对Woodpecker-DL和TensorRT进行了性能测评和比对。实验结果展示在同样GPU上,Woodpecker-DL能取得比TensorRT高达两倍的加速比。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9274
Streaming:
Download:
Share:
 
Abstract:
本次演讲主要是想给大家分享一下腾讯云自然语言处理产品团队在深度学习方面的实践经验,特别是在GPU上做深度学习的经验,包括模型的训练和推理,以及基于GPU的加速实践。首先会简单介绍一下腾讯云自然语言处理的产品矩阵,引出我们产品中与深度学习、GPU使用深度结合的一些点,让大家对腾讯云自然语言处理 ON GPU有一个大概的了解。接下来会以AutoNLP为例子,向大家介绍我们目前是如何基于Bert来为用户提供NLP的PaaS服务,包括:Bert的应用方式;Bert FineTune在CPU和GPU上的性能比对,以及训练的加速;Bert推理在CPU和GPU上的性能比对,以及推理的加速;GPU资源的调度及管理;最后会跟大家分享一下我们AutoNLP的后续规划,包含Model Zoo、AutoML、蒸馏等等 ...Read More
Abstract:
本次演讲主要是想给大家分享一下腾讯云自然语言处理产品团队在深度学习方面的实践经验,特别是在GPU上做深度学习的经验,包括模型的训练和推理,以及基于GPU的加速实践。首先会简单介绍一下腾讯云自然语言处理的产品矩阵,引出我们产品中与深度学习、GPU使用深度结合的一些点,让大家对腾讯云自然语言处理 ON GPU有一个大概的了解。接下来会以AutoNLP为例子,向大家介绍我们目前是如何基于Bert来为用户提供NLP的PaaS服务,包括:Bert的应用方式;Bert FineTune在CPU和GPU上的性能比对,以及训练的加速;Bert推理在CPU和GPU上的性能比对,以及推理的加速;GPU资源的调度及管理;最后会跟大家分享一下我们AutoNLP的后续规划,包含Model Zoo、AutoML、蒸馏等等  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9555
Streaming:
Download:
Share:
 
Abstract:
基于tensorflow的inference优化:通过定制特定维度的高效kernel, 循环不变结点外体,融合op,调整超参数等方法在保持模型精度不变的情况下,提高模型运行速度。 基于tensorflow的transformer模型在mace的适配:通过萃取训练,训练高精度小模型以适用于移动端;通过简化op,拆分encoder,decoder等方法以适配mace框架。 基于tensorflow的模拟局部量化训练:量化推理可有效的降低内存使用率,提升运行速度,然而直接将fp32的数值映射到int8会有精度损失,我们在训练阶段,采用模拟量化训练减小精度损失。因为数值计算稳定性的问题,仅在部分op上采用量化。 基于tensorflow的混合精度训练:为提高训练速度,充分利用tensorcore等资源,我们在tensorflow上引入了amp,在精度不变的情况下,有1.6倍的速度提升。 ...Read More
Abstract:
基于tensorflow的inference优化:通过定制特定维度的高效kernel, 循环不变结点外体,融合op,调整超参数等方法在保持模型精度不变的情况下,提高模型运行速度。 基于tensorflow的transformer模型在mace的适配:通过萃取训练,训练高精度小模型以适用于移动端;通过简化op,拆分encoder,decoder等方法以适配mace框架。 基于tensorflow的模拟局部量化训练:量化推理可有效的降低内存使用率,提升运行速度,然而直接将fp32的数值映射到int8会有精度损失,我们在训练阶段,采用模拟量化训练减小精度损失。因为数值计算稳定性的问题,仅在部分op上采用量化。 基于tensorflow的混合精度训练:为提高训练速度,充分利用tensorcore等资源,我们在tensorflow上引入了amp,在精度不变的情况下,有1.6倍的速度提升。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9432
Streaming:
Download:
Share:
 
Abstract:
听众可以深入地了解作为全球最大的生活服务平台的美团是如何通过研发和推动计算机视觉技术来解决线上和线下遇到的各种挑战,将各种“不可能”逐一变成“可能”,通过科技帮人们吃得更好、生活更好。 图像和视频是美团用来感知和理解其极其丰富的线下场景的重要方式。借助于NVIDIA不断升级的计算能力和我们不断创新的视觉算法,每天1000万级图片的自动安全审核变成了可能,每天60万骑手的线下身份认证变成了可能,自动地数字化千变万化的菜单和招牌变成了可能,海量地图数据生产也变成了可能。在美团,我们没有停止过拓展视觉技术的边界:刷脸支付、自动收银机和智能货架让用户和商户的线下体验不断提升;商超、餐饮和后厨的智能监测系统给予商家360度赋能、也让用户吃得更放心;不久的将来无人配送车也将和外卖小哥为了您更好的生活而并肩作战 。这个演讲将带您一起深入探讨和分解美团是如何通过技术创新来破解实际场景中的各种挑战和谜题。 ...Read More
Abstract:
听众可以深入地了解作为全球最大的生活服务平台的美团是如何通过研发和推动计算机视觉技术来解决线上和线下遇到的各种挑战,将各种“不可能”逐一变成“可能”,通过科技帮人们吃得更好、生活更好。 图像和视频是美团用来感知和理解其极其丰富的线下场景的重要方式。借助于NVIDIA不断升级的计算能力和我们不断创新的视觉算法,每天1000万级图片的自动安全审核变成了可能,每天60万骑手的线下身份认证变成了可能,自动地数字化千变万化的菜单和招牌变成了可能,海量地图数据生产也变成了可能。在美团,我们没有停止过拓展视觉技术的边界:刷脸支付、自动收银机和智能货架让用户和商户的线下体验不断提升;商超、餐饮和后厨的智能监测系统给予商家360度赋能、也让用户吃得更放心;不久的将来无人配送车也将和外卖小哥为了您更好的生活而并肩作战 。这个演讲将带您一起深入探讨和分解美团是如何通过技术创新来破解实际场景中的各种挑战和谜题。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9242
Streaming:
Download:
Share:
 
Abstract:
本报告将结合滴滴在端到端语音AI技术落地过程中的一些探索和实践,从语音技术的发展历程探讨深度学习算法以及高性能计算框架在其中起到的关键作用。语音作为深度学习序列识别算法的应用领域,多种序列建模算法(从端到端的CTC,到Attention乃至于近些年来的Transformer以及无监督预训练)在语音领域中得到的广泛应用,一方面带来了识别性能的显著提升,另外也带来了多种新的计算框架和应用的挑战。 ...Read More
Abstract:
本报告将结合滴滴在端到端语音AI技术落地过程中的一些探索和实践,从语音技术的发展历程探讨深度学习算法以及高性能计算框架在其中起到的关键作用。语音作为深度学习序列识别算法的应用领域,多种序列建模算法(从端到端的CTC,到Attention乃至于近些年来的Transformer以及无监督预训练)在语音领域中得到的广泛应用,一方面带来了识别性能的显著提升,另外也带来了多种新的计算框架和应用的挑战。   Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9639
Download:
Share:
 
Abstract:
AI 已经在人脸识别,自动驾驶和医疗健康领域产生了技术上的突破。对于健康领域,最积极的应用领域是医疗图像。本演讲介绍采用 NVIDIA GPU 做出的算法创新,临床应用和这个行业的前瞻。 医疗图像中的算法创新的方向包括检测,分割,配准,分类,映射等。临床的 AI 应用也非常的广泛,涉及到包括质量控制,加速,降低放射剂量,CAD 等等很长的工作流程。本演讲介绍这些医疗图像中独特的挑战和应对。 ...Read More
Abstract:
AI 已经在人脸识别,自动驾驶和医疗健康领域产生了技术上的突破。对于健康领域,最积极的应用领域是医疗图像。本演讲介绍采用 NVIDIA GPU 做出的算法创新,临床应用和这个行业的前瞻。 医疗图像中的算法创新的方向包括检测,分割,配准,分类,映射等。临床的 AI 应用也非常的广泛,涉及到包括质量控制,加速,降低放射剂量,CAD 等等很长的工作流程。本演讲介绍这些医疗图像中独特的挑战和应对。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9913
Share:
 
Abstract:
生命科学和计算科学的结合是21世纪最重要的科学前沿。生命是非线性自适应共生开放的复杂系统,这一系统的运算引擎是非随机选择性迭代概率计算。健康是你的选择。获取并掌握生命数据的自由,训练个性化、适应性健康生活方式养成,才能活得更健康、更长寿。通过人工智能算法和GPU加速,健康大数据分析得以普及给每一人,把数据的管理权还给每一个人。本演讲介绍了我们的处理和分析基因数据,医疗图像数据,运动数据等健康数据的模型。 ...Read More
Abstract:
生命科学和计算科学的结合是21世纪最重要的科学前沿。生命是非线性自适应共生开放的复杂系统,这一系统的运算引擎是非随机选择性迭代概率计算。健康是你的选择。获取并掌握生命数据的自由,训练个性化、适应性健康生活方式养成,才能活得更健康、更长寿。通过人工智能算法和GPU加速,健康大数据分析得以普及给每一人,把数据的管理权还给每一个人。本演讲介绍了我们的处理和分析基因数据,医疗图像数据,运动数据等健康数据的模型。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9787
Download:
Share:
 
Abstract:
Faster Transformer是NVIDIA针对Transformer网络优化工作的开源项目。本次talk中,我们将会介绍如何通过CUDA和cuBLAS搭建高效的Transformer Encoder和Decoder推理网络,同时也会从Network Pruning的角度讲解如何结合算法以及Faster Transformer框架实现裁剪BERT网络的推理优化。 ...Read More
Abstract:
Faster Transformer是NVIDIA针对Transformer网络优化工作的开源项目。本次talk中,我们将会介绍如何通过CUDA和cuBLAS搭建高效的Transformer Encoder和Decoder推理网络,同时也会从Network Pruning的角度讲解如何结合算法以及Faster Transformer框架实现裁剪BERT网络的推理优化。  Back
 
Topics:
Artificial Intelligence and Deep Learning
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9468
Streaming:
Download:
Share:
Autonomous Vehicles
Presentation
Media
Abstract:
具体介绍 NVIDIA 的自动驾驶架构,内容涵盖基于 GPU 的统一硬件平台,和完整的软件栈:包括操作系统,底层 sdk 和 L2+-L4 的自动驾驶应用,着重介绍完整的感知、规划决策、控制、可视化和数据记录等完整流程。 ...Read More
Abstract:
具体介绍 NVIDIA 的自动驾驶架构,内容涵盖基于 GPU 的统一硬件平台,和完整的软件栈:包括操作系统,底层 sdk 和 L2+-L4 的自动驾驶应用,着重介绍完整的感知、规划决策、控制、可视化和数据记录等完整流程。  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9618
Streaming:
Download:
Share:
 
Abstract:
L4 级自动驾驶技术的发展正迈向真正的商业化应用,以处理真实世界中发生的复杂场景和长尾问题,包括大规模数据处理,基于云的仿真平台,以及感知、预测和规划的关键能力。
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9369
Share:
 
Abstract:
汽车行业正在快速发展以实现不同程度的自动驾驶。虽然业内已将很多资源投入于使用强大感知力和计算能力但成本高的无人驾驶技术在机器人出租车等使用场景中落地,更多的汽车制造商却正全力以赴争取在 2021 年至 2023 年期间,以有限的计算能力和使用低成本传感器,包括摄像机、雷达和低成本 GPS 接收器的条件下,将当前的高级驾驶员辅助(ADAS)系统逐步扩展到部分自动驾驶(SAE Level 2)和/或有条件自动驾驶(SAE Level 3)。在本次演讲中,我们将剖析在这些限制条件下在量产车上逐步实现自动驾驶的关键技术和系统性挑战,以及小鹏汽车在中国市场计划如何迎接这些挑战。在这里,尤其关键的是通过 GPU 和 DLA 实现的低成本的大规模深度学习运算能力。我们期望小鹏和 NVIDIA 的深度合作可以帮助我们建立和保持小鹏在中国市场上自动驾驶的领先地位。 ...Read More
Abstract:
汽车行业正在快速发展以实现不同程度的自动驾驶。虽然业内已将很多资源投入于使用强大感知力和计算能力但成本高的无人驾驶技术在机器人出租车等使用场景中落地,更多的汽车制造商却正全力以赴争取在 2021 年至 2023 年期间,以有限的计算能力和使用低成本传感器,包括摄像机、雷达和低成本 GPS 接收器的条件下,将当前的高级驾驶员辅助(ADAS)系统逐步扩展到部分自动驾驶(SAE Level 2)和/或有条件自动驾驶(SAE Level 3)。在本次演讲中,我们将剖析在这些限制条件下在量产车上逐步实现自动驾驶的关键技术和系统性挑战,以及小鹏汽车在中国市场计划如何迎接这些挑战。在这里,尤其关键的是通过 GPU 和 DLA 实现的低成本的大规模深度学习运算能力。我们期望小鹏和 NVIDIA 的深度合作可以帮助我们建立和保持小鹏在中国市场上自动驾驶的领先地位。   Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9721
Share:
 
Abstract:
作为致力于将人工智能技术应用在物流行业的领先科技型企业,智加科技将分享其在干线物流自动驾驶上的最新进展。本次演讲将深入分析当前物流行业现状,探讨自动驾驶重卡落地和量产的 5 个阶段,并通过视频等形式展示我们在自动驾驶重卡的研发和落地运营中的核心技术,该内容将包含 NVIDIA GPU 在数据采集、模型训练、在线推理、仿真测试中的应用。 ...Read More
Abstract:
作为致力于将人工智能技术应用在物流行业的领先科技型企业,智加科技将分享其在干线物流自动驾驶上的最新进展。本次演讲将深入分析当前物流行业现状,探讨自动驾驶重卡落地和量产的 5 个阶段,并通过视频等形式展示我们在自动驾驶重卡的研发和落地运营中的核心技术,该内容将包含 NVIDIA GPU 在数据采集、模型训练、在线推理、仿真测试中的应用。  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9435
Share:
 
Abstract:
在本演讲中,将介绍奇点汽车基于 NVIDIA 平台 Xavier 研发自动驾驶技术的进展,主要讨论基于摄像头的低成本自动驾驶地图的开发。
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9395
Share:
 
Abstract:
作为 NVIDIA 在自动驾驶的重要合作伙伴,德赛西威基于 NVIDIA Xavier 开发了自动驾驶平台,并将于 2020 年量产。本演讲主要内容将涵盖: 1)自动驾驶平台量产的挑战; 2)NVIDIA Xavier 加速自动驾驶平台落地; 3)面向量产的自动驾驶平台设计关键要素; 4)基于Xavier的自动驾驶平台功能开发过程介绍; 5)合作开放的生态体系。 ...Read More
Abstract:
作为 NVIDIA 在自动驾驶的重要合作伙伴,德赛西威基于 NVIDIA Xavier 开发了自动驾驶平台,并将于 2020 年量产。本演讲主要内容将涵盖: 1)自动驾驶平台量产的挑战; 2)NVIDIA Xavier 加速自动驾驶平台落地; 3)面向量产的自动驾驶平台设计关键要素; 4)基于Xavier的自动驾驶平台功能开发过程介绍; 5)合作开放的生态体系。   Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9599
Share:
 
Abstract:
Momenta 定位于打造自动驾驶大脑,核心技术是基于深度学习的环境感知、高精地图和驾驶决策算法,产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。Momenta 的战略是量产自动驾驶(Mpilot)与完全无人驾驶(MSD)两条腿走路,通过数据、数据驱动算法和两者之间的迭代闭环,推动自动驾驶技术落地量产,并最终实现无人驾驶。 ...Read More
Abstract:
Momenta 定位于打造自动驾驶大脑,核心技术是基于深度学习的环境感知、高精地图和驾驶决策算法,产品包括不同级别的自动驾驶方案,以及衍生出的大数据服务。Momenta 的战略是量产自动驾驶(Mpilot)与完全无人驾驶(MSD)两条腿走路,通过数据、数据驱动算法和两者之间的迭代闭环,推动自动驾驶技术落地量产,并最终实现无人驾驶。   Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9230
Share:
 
Abstract:
中国和美国多变复杂的道路场景对小马智行研发的自动驾驶技术提出了更高更严格的要求。小马智行资深技术总监张宁将在本次演讲中分享小马智行在自动驾驶领域取得的最新技术进展以及在中美不同路况下的的技术处理经验。 ...Read More
Abstract:
中国和美国多变复杂的道路场景对小马智行研发的自动驾驶技术提出了更高更严格的要求。小马智行资深技术总监张宁将在本次演讲中分享小马智行在自动驾驶领域取得的最新技术进展以及在中美不同路况下的的技术处理经验。   Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9769
Share:
 
Abstract:
在本次演讲中,AutoX 创始人肖健雄博士将为大家介绍其团队如何借助 NVIDIA GPU 提供的硬件支持打造出中国首个可稳定驾驭国内繁华都市路况的自动驾驶系统。 在公司成立以来的三年时间中,AutoX 先后推出了加州首个无人驾驶外送服务和无人驾驶出租车服务,其专为中国繁华都市路况打造的无人驾驶系统 xUrban 更在无人驾驶领域首先实现了对深圳等繁华中心路况的熟练驾驭。在竞争极其激烈的无人驾驶领域,AutoX 和其精干的研发队伍后发先至,率先达到了多个技术和商业里程碑。在此次演讲中,AutoX 创始人肖健雄教授将介绍 AutoX 团队的主要研发进展,未来技术展望,以及新一代 GPU 对无人驾驶技术发展的关键作用。 ...Read More
Abstract:
在本次演讲中,AutoX 创始人肖健雄博士将为大家介绍其团队如何借助 NVIDIA GPU 提供的硬件支持打造出中国首个可稳定驾驭国内繁华都市路况的自动驾驶系统。 在公司成立以来的三年时间中,AutoX 先后推出了加州首个无人驾驶外送服务和无人驾驶出租车服务,其专为中国繁华都市路况打造的无人驾驶系统 xUrban 更在无人驾驶领域首先实现了对深圳等繁华中心路况的熟练驾驭。在竞争极其激烈的无人驾驶领域,AutoX 和其精干的研发队伍后发先至,率先达到了多个技术和商业里程碑。在此次演讲中,AutoX 创始人肖健雄教授将介绍 AutoX 团队的主要研发进展,未来技术展望,以及新一代 GPU 对无人驾驶技术发展的关键作用。  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9111
Share:
 
Abstract:
上汽集团基于 NVIDIA DGX-1 打造了 iGear AI 全流程工作,用以训练自动驾驶及其他智能化场景的模型。iGear AI 平台包含视频图片场景分类、各类标注工具,Web 化调试开发界面,以及规模化的各类神经网络开发框架和预训练模型的调度,并打通了后续模型验证和仿真测试的环节。基于 iGear AI 平台,上汽正在研发智能制造、智能驾驶战略下的场景应用。 ...Read More
Abstract:
上汽集团基于 NVIDIA DGX-1 打造了 iGear AI 全流程工作,用以训练自动驾驶及其他智能化场景的模型。iGear AI 平台包含视频图片场景分类、各类标注工具,Web 化调试开发界面,以及规模化的各类神经网络开发框架和预训练模型的调度,并打通了后续模型验证和仿真测试的环节。基于 iGear AI 平台,上汽正在研发智能制造、智能驾驶战略下的场景应用。  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9775
Streaming:
Download:
Share:
 
Abstract:
演讲首先将从落地场景出发,谈及为何L3将成为分水岭,解锁干线物流行业规模化的瓶颈。一个端到端的闭环模式如何能成为自动驾驶产业落地的最有效途径。 演讲将阐述量产开发的双重技术挑战,从自动驾驶技术和车规级量产的角度,从几个不同方面提出嬴彻独特的技术解决之道。首先是基于从安全出发的自动驾驶开发的“四项基本原则”。在此开发原则上,一方面通过自动驾驶软件算法与整车集成的协同研发车规级自动驾驶技术,另一方面展开与上下游产业的广泛协作。在这其中,GPU 也扮演着重要角色。 ...Read More
Abstract:
演讲首先将从落地场景出发,谈及为何L3将成为分水岭,解锁干线物流行业规模化的瓶颈。一个端到端的闭环模式如何能成为自动驾驶产业落地的最有效途径。 演讲将阐述量产开发的双重技术挑战,从自动驾驶技术和车规级量产的角度,从几个不同方面提出嬴彻独特的技术解决之道。首先是基于从安全出发的自动驾驶开发的“四项基本原则”。在此开发原则上,一方面通过自动驾驶软件算法与整车集成的协同研发车规级自动驾驶技术,另一方面展开与上下游产业的广泛协作。在这其中,GPU 也扮演着重要角色。  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9984
Share:
 
Abstract:
自动驾驶 ECU 的开发需要通过深度学习构建的复杂神经网络来训练大量数据集。探讨和讨论大规模深度学习基础架构在自动驾驶中的重要性,如何利用大规模的深度学习基础架构加速整个自动驾驶的研发和落地。 1. 为什么研发自动驾驶需要考量大规模的深度学习平台? 2. 加速自动驾驶落地的大规模深度学习研发平台的生命周期和最佳实践: 2.1 大量的数据采集车载传感器数据摄取和数据转换成合适的深度学习模式 2.2 如何建立合适的自动驾驶数据管理平台 2.3 如何搭建大规模的深度学习平台最大化利用 GPU/CPU 并且缩短研发周期 2.4 如何进行海量数据分析缩短研发周期 2.5 性能和针对中国市场自动驾驶数据合规性的最佳实践 ...Read More
Abstract:
自动驾驶 ECU 的开发需要通过深度学习构建的复杂神经网络来训练大量数据集。探讨和讨论大规模深度学习基础架构在自动驾驶中的重要性,如何利用大规模的深度学习基础架构加速整个自动驾驶的研发和落地。 1. 为什么研发自动驾驶需要考量大规模的深度学习平台? 2. 加速自动驾驶落地的大规模深度学习研发平台的生命周期和最佳实践: 2.1 大量的数据采集车载传感器数据摄取和数据转换成合适的深度学习模式 2.2 如何建立合适的自动驾驶数据管理平台 2.3 如何搭建大规模的深度学习平台最大化利用 GPU/CPU 并且缩短研发周期 2.4 如何进行海量数据分析缩短研发周期 2.5 性能和针对中国市场自动驾驶数据合规性的最佳实践  Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9361
Streaming:
Download:
Share:
 
Abstract:
无人驾驶不仅是当前全球最前沿的科技领域,也是一项非常复杂的系统工程,并且对稳定性和可靠性有着非常严苛的要求。大量需要实时处理的多传感器融合数据,无疑是对系统算力及其可靠性的巨大考验。本次演讲,图森未来COO 郝佳男将结合图森未来超百万公里的 L4 级无人驾驶路测经验,以及超过一年的无人驾驶卡车常态化商业运营实践,详细介绍 NVIDIA 车规级芯片如何助力无人驾驶系统可靠、安全地运行。 ...Read More
Abstract:
无人驾驶不仅是当前全球最前沿的科技领域,也是一项非常复杂的系统工程,并且对稳定性和可靠性有着非常严苛的要求。大量需要实时处理的多传感器融合数据,无疑是对系统算力及其可靠性的巨大考验。本次演讲,图森未来COO 郝佳男将结合图森未来超百万公里的 L4 级无人驾驶路测经验,以及超过一年的无人驾驶卡车常态化商业运营实践,详细介绍 NVIDIA 车规级芯片如何助力无人驾驶系统可靠、安全地运行。   Back
 
Topics:
Autonomous Vehicles
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9562
Share:
HPC and Supercomputing
Presentation
Media
Abstract:
5G+AI 赋能产业生态,让参会者了解基于 5G+AI 技术,能够给产业代来什么翻天覆地的变化,想了解新技术如何颠覆传统产业的,听了本次演讲,一定会有收获。本次主要以 5G 核心技术为基础,结合 AI,赋能到教育,医疗,农业,无人机四大领域,目前结合的成果以及一些落地的案例等。 ...Read More
Abstract:
5G+AI 赋能产业生态,让参会者了解基于 5G+AI 技术,能够给产业代来什么翻天覆地的变化,想了解新技术如何颠覆传统产业的,听了本次演讲,一定会有收获。本次主要以 5G 核心技术为基础,结合 AI,赋能到教育,医疗,农业,无人机四大领域,目前结合的成果以及一些落地的案例等。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9350
Share:
 
Abstract:
为参会者阐述运营商人工智能发展思路、技术路线和典型案例。讲解运营商网络重构、智慧运营和 5G 规划建设中的难点和瓶颈,以及人工智能技术所能发挥的成效、基于 NVIDIA GPU 的工程实践。 ...Read More
Abstract:
为参会者阐述运营商人工智能发展思路、技术路线和典型案例。讲解运营商网络重构、智慧运营和 5G 规划建设中的难点和瓶颈,以及人工智能技术所能发挥的成效、基于 NVIDIA GPU 的工程实践。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9784
Streaming:
Download:
Share:
 
Abstract:
中国移动统一 AI 平台采用 Kubernetes+Docker 的基础架构,以 NVIDIA NGC 提供的镜像为基础,集成了 TensorFlow、PyTorch、Caffe 等主流 AI 算法框架,基于 RAPIDS 算法库利用 GPU 实现对传统机器学习的 10 倍以上加速,规模化承载 AI 应用,为集团节约成本高达 5 亿元/年。 ...Read More
Abstract:
中国移动统一 AI 平台采用 Kubernetes+Docker 的基础架构,以 NVIDIA NGC 提供的镜像为基础,集成了 TensorFlow、PyTorch、Caffe 等主流 AI 算法框架,基于 RAPIDS 算法库利用 GPU 实现对传统机器学习的 10 倍以上加速,规模化承载 AI 应用,为集团节约成本高达 5 亿元/年。   Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9162
Share:
 
Abstract:
通信网络的发展对智能化的需求越来越迫切。 近年来,ICT 行业都在积极开展网络智能化研究,但智能化分级和等级验证工作却鲜有成效。研究制定行业共同认可的通信网络智能化能力分级方法,能够为行业提供衡量通信网络(及其组成部分)智能化能力等级的评价依据,促进全行业形成对智能化网络等相关概念的统一认识和理解。进行网络智能化等级验证工作,一方面可以通过实践为网络智能化等级划分方法的完善提供指导,另一方面,可以通过对现网智能化程度的评估,发现网络中的潜在问题和不足之处,为未来网络的发展规划提供决策参考。 本次演讲面向通信网络智能化分级验证实践落地,首先分析了当前通信网络智能化分级研究的现状、标准和验证驱动,梳理了通信网络智能化场景,描述了通信网络智能化分级验证范围,提出了一套基于通信网络智能化分级标准进行落地验证的方法和流程,最后重点分析了中国联通江苏省分公司网络智能监控系统智能化评估的实践案例。我们期望与产业各界共同探讨通信网络智能化分级落地模式,共建通信网络智能化评估体系,全面推动通信网络智能化的发展。 ...Read More
Abstract:
通信网络的发展对智能化的需求越来越迫切。 近年来,ICT 行业都在积极开展网络智能化研究,但智能化分级和等级验证工作却鲜有成效。研究制定行业共同认可的通信网络智能化能力分级方法,能够为行业提供衡量通信网络(及其组成部分)智能化能力等级的评价依据,促进全行业形成对智能化网络等相关概念的统一认识和理解。进行网络智能化等级验证工作,一方面可以通过实践为网络智能化等级划分方法的完善提供指导,另一方面,可以通过对现网智能化程度的评估,发现网络中的潜在问题和不足之处,为未来网络的发展规划提供决策参考。 本次演讲面向通信网络智能化分级验证实践落地,首先分析了当前通信网络智能化分级研究的现状、标准和验证驱动,梳理了通信网络智能化场景,描述了通信网络智能化分级验证范围,提出了一套基于通信网络智能化分级标准进行落地验证的方法和流程,最后重点分析了中国联通江苏省分公司网络智能监控系统智能化评估的实践案例。我们期望与产业各界共同探讨通信网络智能化分级落地模式,共建通信网络智能化评估体系,全面推动通信网络智能化的发展。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9993
Download:
Share:
 
Abstract:
2019 年,AR 云及其云服务和能力融合框架进去了百舸争流的快速发展阶段。各 ICT,人工智能以及互联网的领军企业纷纷发布了令人炫目的新技术并拓展其基于云的服务模式。中兴通讯将深入分析 AR 核心技术框架,AR 云的定义和作用,AR 云近期技术发展,AR云 @5G 中的核心技术路径,以及如何把握 AR 边缘云 @5G 的大趋势,介绍中兴通讯在 AR 云的技术储备和核心技术 ...Read More
Abstract:
2019 年,AR 云及其云服务和能力融合框架进去了百舸争流的快速发展阶段。各 ICT,人工智能以及互联网的领军企业纷纷发布了令人炫目的新技术并拓展其基于云的服务模式。中兴通讯将深入分析 AR 核心技术框架,AR 云的定义和作用,AR 云近期技术发展,AR云 @5G 中的核心技术路径,以及如何把握 AR 边缘云 @5G 的大趋势,介绍中兴通讯在 AR 云的技术储备和核心技术  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9808
Streaming:
Download:
Share:
 
Abstract:
利用高性能计算资源扩展人工智能算法的规模从而支持大规模训练任务的经验和范例。高能计算计算资源为人工智能提供高效和海量的计算能力,深度学习神经网络固有的并行特征非常适合于高度并行的高性能计算环境。海量计算密集型和内存密集型的任务能够有效利用匹配大量高性能计算资源,在短时间完成海量训练任务。大规模的计算能力能够极大地扩展人工智能算法的规模,有效加速深度学习网络的探索、评估和优化等方面的性能,从而支撑和解决更大规模的问题。在人工智能和高性能计算融合的基础上,本报告首先讨论基于高性能计算资源的人工智能计算平台,构建计算资源、存储资源和应用为一体的服务平台,分别在资源、平台和应用等多个层面提供人工智能计算、数据和应用服务。然后,以气象、新能源、新材料、先进制造、生物制药和生态服务等领域的应用为范例,阐述高性能计算如何在这些领域加速人工智能技术的应用与发展。 ...Read More
Abstract:
利用高性能计算资源扩展人工智能算法的规模从而支持大规模训练任务的经验和范例。高能计算计算资源为人工智能提供高效和海量的计算能力,深度学习神经网络固有的并行特征非常适合于高度并行的高性能计算环境。海量计算密集型和内存密集型的任务能够有效利用匹配大量高性能计算资源,在短时间完成海量训练任务。大规模的计算能力能够极大地扩展人工智能算法的规模,有效加速深度学习网络的探索、评估和优化等方面的性能,从而支撑和解决更大规模的问题。在人工智能和高性能计算融合的基础上,本报告首先讨论基于高性能计算资源的人工智能计算平台,构建计算资源、存储资源和应用为一体的服务平台,分别在资源、平台和应用等多个层面提供人工智能计算、数据和应用服务。然后,以气象、新能源、新材料、先进制造、生物制药和生态服务等领域的应用为范例,阐述高性能计算如何在这些领域加速人工智能技术的应用与发展。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9693
Streaming:
Share:
 
Abstract:
Optick 是基于 NVIDIA OptiX 和 Geant4 toolkit 开发的开源模拟软件。计算机工作站 GPU 上的测试表明: Opticks 拥有强大的并行计算能力,可以将 CPU 上的 Geant4 光子模拟速度提高 1000 倍以上。拥有 Turing 架构的 NVIDIA RTX 处理器可以针对 ray tracing 进行硬件级别的加速,使得模拟速度进一步提高 6 倍以上。Geant4 模拟包括光子散射、吸收、和重发射等物理过程,这些作用过程在 Opticks 中都利用 CUDA 进行了重新设计和实现。材料的光学属性依赖于光子的波长。这些光学属性基于 GPU texture 实现了快速的插值和抽样方法。此外,Opticks 软件可以把 GPU ray tracing 使用的复杂 CSG 几何(Constructive Solid Geometry)自动转换成 Geant4 模拟使用的几何,并且保证两种模拟使用完全一致的几何描述。 ...Read More
Abstract:
Optick 是基于 NVIDIA OptiX 和 Geant4 toolkit 开发的开源模拟软件。计算机工作站 GPU 上的测试表明: Opticks 拥有强大的并行计算能力,可以将 CPU 上的 Geant4 光子模拟速度提高 1000 倍以上。拥有 Turing 架构的 NVIDIA RTX 处理器可以针对 ray tracing 进行硬件级别的加速,使得模拟速度进一步提高 6 倍以上。Geant4 模拟包括光子散射、吸收、和重发射等物理过程,这些作用过程在 Opticks 中都利用 CUDA 进行了重新设计和实现。材料的光学属性依赖于光子的波长。这些光学属性基于 GPU texture 实现了快速的插值和抽样方法。此外,Opticks 软件可以把 GPU ray tracing 使用的复杂 CSG 几何(Constructive Solid Geometry)自动转换成 Geant4 模拟使用的几何,并且保证两种模拟使用完全一致的几何描述。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9894
Streaming:
Download:
Share:
 
Abstract:
VASP 是用于原子级材料建模的软件包。 它是用于电子结构计算和第一性原理分子动力学的最广泛使用的代码之一。 我们将概述通过 OpenACC 将 VASP 移植到 GPU 的状态。 以前将 VASP 的某些部分移植到 CUDA C 时,可以在 GPU 上实现良好的加速,但是由于 VASP 完全用Fortran 编写,因此增加了维护工作量。 我们将讨论 OpenACC 相对于 CUDA 的性能,OpenACC 对 VASP 代码维护的影响以及与聚合数据结构管理相关的端口挑战。 最后,我们将讨论未来可能的数据管理解决方案,这些解决方案将简化 VASP 的新开发和维护以及 GPU 上的类似大型生产应用程序。 ...Read More
Abstract:
VASP 是用于原子级材料建模的软件包。 它是用于电子结构计算和第一性原理分子动力学的最广泛使用的代码之一。 我们将概述通过 OpenACC 将 VASP 移植到 GPU 的状态。 以前将 VASP 的某些部分移植到 CUDA C 时,可以在 GPU 上实现良好的加速,但是由于 VASP 完全用Fortran 编写,因此增加了维护工作量。 我们将讨论 OpenACC 相对于 CUDA 的性能,OpenACC 对 VASP 代码维护的影响以及与聚合数据结构管理相关的端口挑战。 最后,我们将讨论未来可能的数据管理解决方案,这些解决方案将简化 VASP 的新开发和维护以及 GPU 上的类似大型生产应用程序。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9601
Streaming:
Download:
Share:
 
Abstract:
以若干具体任务为例,简要介绍深度学习背景下多模态语义理解的应用场景及其研究进展。多种不同模态数据的相互融合,能够更加全面而高效的传递信息,帮助人类更好的理解周围环境。为了让机器也具备更好的环境感知能力,对多种不同模态数据进行语义理解成为一个值得关注且具有广泛应用前景的研究领域。本次演讲将选取典型的若干应用,介绍其应用场景及研究进展,使得听众对于跨模态语义理解的当前研究状况及未来发展趋势有所了解。 在介绍跨模态领域研究现状的基础上,会详细介绍我们实验室最新的一些研究成果。所涉及成果均是利用 GPU 进行深度学习训练所获得,为当前该领域最先进的研究进展,其公开发表在该领域顶级学术会议或在国际比赛中获奖。 ...Read More
Abstract:
以若干具体任务为例,简要介绍深度学习背景下多模态语义理解的应用场景及其研究进展。多种不同模态数据的相互融合,能够更加全面而高效的传递信息,帮助人类更好的理解周围环境。为了让机器也具备更好的环境感知能力,对多种不同模态数据进行语义理解成为一个值得关注且具有广泛应用前景的研究领域。本次演讲将选取典型的若干应用,介绍其应用场景及研究进展,使得听众对于跨模态语义理解的当前研究状况及未来发展趋势有所了解。 在介绍跨模态领域研究现状的基础上,会详细介绍我们实验室最新的一些研究成果。所涉及成果均是利用 GPU 进行深度学习训练所获得,为当前该领域最先进的研究进展,其公开发表在该领域顶级学术会议或在国际比赛中获奖。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9965
Share:
 
Abstract:
近年来传统的卷积神经网络在图像、视频、语音、自然语言、围棋等领域的应用取得了巨大的成功,但是由于其本身网络结构的局限性,仍然有很多数据类型是传统卷积神经网络无法处理的,比如社交网络,分子结构,3D 点云,3D 格珊等,图卷积网络 (GCN) 在处理这类非规则数据的过程中具有很大优势,但目前的 GCN 规模较小,在加深深度的过程中由于梯度消失和过度平滑问题限制图卷积网络的进一步发展,目前常见的图卷积神经网络一般都是 3、4 层,我们关注的问题是图卷积神经网络 GCN 是否也能和一般的卷积神经网络 CNN 一样加深到 50+ 层而不会有 Vanishing Gradient 问题,研究人员提出了 ResGCNs,DenseGCNs 和 Dilated GCN,MRGCN 等结构,甚至能训练收敛 152 层 GCN,并在点云分割任务上取得了比较好的效果。 ...Read More
Abstract:
近年来传统的卷积神经网络在图像、视频、语音、自然语言、围棋等领域的应用取得了巨大的成功,但是由于其本身网络结构的局限性,仍然有很多数据类型是传统卷积神经网络无法处理的,比如社交网络,分子结构,3D 点云,3D 格珊等,图卷积网络 (GCN) 在处理这类非规则数据的过程中具有很大优势,但目前的 GCN 规模较小,在加深深度的过程中由于梯度消失和过度平滑问题限制图卷积网络的进一步发展,目前常见的图卷积神经网络一般都是 3、4 层,我们关注的问题是图卷积神经网络 GCN 是否也能和一般的卷积神经网络 CNN 一样加深到 50+ 层而不会有 Vanishing Gradient 问题,研究人员提出了 ResGCNs,DenseGCNs 和 Dilated GCN,MRGCN 等结构,甚至能训练收敛 152 层 GCN,并在点云分割任务上取得了比较好的效果。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9363
Streaming:
Download:
Share:
 
Abstract:
数据正在从根本上改变企业的经营方式,推动了对数据科学家的需求,同时增加其工作流程的复杂性。GPU 加速对于快速将海量数据转变为见解,并使企业能够提供令人惊叹的产品和服务至关重要。通过这篇演讲,我们可以了解到,由 nvidia gpus 和 cuda-x 人工智能数据科学软件支持的新桌面和数据中心解决方案,将会为数据科学家提供全集成的开发体验。 ...Read More
Abstract:
数据正在从根本上改变企业的经营方式,推动了对数据科学家的需求,同时增加其工作流程的复杂性。GPU 加速对于快速将海量数据转变为见解,并使企业能够提供令人惊叹的产品和服务至关重要。通过这篇演讲,我们可以了解到,由 nvidia gpus 和 cuda-x 人工智能数据科学软件支持的新桌面和数据中心解决方案,将会为数据科学家提供全集成的开发体验。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9172
Streaming:
Download:
Share:
 
Abstract:
机器学习、深度学习正在真正落地到各行各业的应用场景中,选择灵活的数据科学平台可以帮助企业在机器学习领域快速上手、快速推广。今天的数据科学与以往大不相同,过去企业大数据分析主要处理来自企业内部的结构化数据,以事后总结为主。今天采用了经典机器学习、深度学习的人工智能,能够帮助企业做到事前发现、事前预测、并迈向自主决策自适应。选择合适的数据科学平台,能够帮助企业降低开发门槛,专注于机器学习模型、数据科学价值的挖掘和利用。NVIDIA RAPIDS 数据科学平台助力您加速数据科学转变成商业洞察。 ...Read More
Abstract:
机器学习、深度学习正在真正落地到各行各业的应用场景中,选择灵活的数据科学平台可以帮助企业在机器学习领域快速上手、快速推广。今天的数据科学与以往大不相同,过去企业大数据分析主要处理来自企业内部的结构化数据,以事后总结为主。今天采用了经典机器学习、深度学习的人工智能,能够帮助企业做到事前发现、事前预测、并迈向自主决策自适应。选择合适的数据科学平台,能够帮助企业降低开发门槛,专注于机器学习模型、数据科学价值的挖掘和利用。NVIDIA RAPIDS 数据科学平台助力您加速数据科学转变成商业洞察。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9942
Download:
Share:
 
Abstract:
数据科学家借助 RAPIDS,可以使用 GPU 加速数据科学从数据预处理、机器学习训练、预测等整个流程。对于一个大规模的数据科学任务,除了数据科学算法以外,数据科学家还需要关注他们并不擅长的软件部署、资源分配与调度、任务管理与监控等。阿里云提供的弹性 GPU服务与容器服务深度结合,帮助数据科学家大大简化了一个数据科学任务的运行和管理过程,使得数据科学家可以更多的关心跟算法和数据分析本身相关的工作。同时针对不同业务场景,提供了性能和资源管理的优化,使得数据科学家在云端可以方便、高效的使用 GPU 加速数据科学任务。 ...Read More
Abstract:
数据科学家借助 RAPIDS,可以使用 GPU 加速数据科学从数据预处理、机器学习训练、预测等整个流程。对于一个大规模的数据科学任务,除了数据科学算法以外,数据科学家还需要关注他们并不擅长的软件部署、资源分配与调度、任务管理与监控等。阿里云提供的弹性 GPU服务与容器服务深度结合,帮助数据科学家大大简化了一个数据科学任务的运行和管理过程,使得数据科学家可以更多的关心跟算法和数据分析本身相关的工作。同时针对不同业务场景,提供了性能和资源管理的优化,使得数据科学家在云端可以方便、高效的使用 GPU 加速数据科学任务。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9180
Streaming:
Download:
Share:
 
Abstract:
演讲内容主要为参会者提供GPU在数据科学计算领域的一线实践介绍,为参会者提供可以参照的实践经验。主要介绍百度的 Jarvis 系统如何利用 GPU 来加速数据科学计算,会简要介绍整个系统的设计理念和实现架构。并且重点介绍,基于 GPU 加速在一些应用场景的落地实践效果。 ...Read More
Abstract:
演讲内容主要为参会者提供GPU在数据科学计算领域的一线实践介绍,为参会者提供可以参照的实践经验。主要介绍百度的 Jarvis 系统如何利用 GPU 来加速数据科学计算,会简要介绍整个系统的设计理念和实现架构。并且重点介绍,基于 GPU 加速在一些应用场景的落地实践效果。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9860
Download:
Share:
 
Abstract:
地理信息数据可视化数据现实平台-能够将空间分布规律更加简洁直观的展示,解决传统数据分析中对地理信息处理的难点。新一代异构众核数据现实引擎 - MegaWise ,针对地理信息大数据分析在速度,规模和交互性等方面的挑战,推出了高性能 SQL 引擎、图像渲染引擎及可视化套件等产品套件,深度整合了RAPIDS 数据科学平台以及英伟达图形处理单元(GPU)的大规模并行处理和视觉渲染能力,真正做到了高吞吐、高性价比、低延时的可视化、交互式数据分析方案。能够在单台 GPU 服务器上对十亿级地理信息数据集进行可视化分析,并获得秒内响应。此次演讲将会带您走进 Megawise 数据现实引擎的世界,为您介绍架构设计、展示极致的数据分析能力以及实用案例分享。 ...Read More
Abstract:
地理信息数据可视化数据现实平台-能够将空间分布规律更加简洁直观的展示,解决传统数据分析中对地理信息处理的难点。新一代异构众核数据现实引擎 - MegaWise ,针对地理信息大数据分析在速度,规模和交互性等方面的挑战,推出了高性能 SQL 引擎、图像渲染引擎及可视化套件等产品套件,深度整合了RAPIDS 数据科学平台以及英伟达图形处理单元(GPU)的大规模并行处理和视觉渲染能力,真正做到了高吞吐、高性价比、低延时的可视化、交互式数据分析方案。能够在单台 GPU 服务器上对十亿级地理信息数据集进行可视化分析,并获得秒内响应。此次演讲将会带您走进 Megawise 数据现实引擎的世界,为您介绍架构设计、展示极致的数据分析能力以及实用案例分享。   Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9699
Download:
Share:
 
Abstract:
Mars 是基于张量的超大规模计算框架,目标是将 numpy、pandas、scikit-learn 等 scipy 技术栈并行和分布式化。得益于 RAPIDS 平台和社区的高度兼容,Mars 也支持在 GPU 上来加速分布式海量数据处理。本次演讲将会重点介绍 Mars 和 RAPIDS 如何集成来加速数据处理,这背后的原理,以及相关实战。 ...Read More
Abstract:
Mars 是基于张量的超大规模计算框架,目标是将 numpy、pandas、scikit-learn 等 scipy 技术栈并行和分布式化。得益于 RAPIDS 平台和社区的高度兼容,Mars 也支持在 GPU 上来加速分布式海量数据处理。本次演讲将会重点介绍 Mars 和 RAPIDS 如何集成来加速数据处理,这背后的原理,以及相关实战。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9280
Streaming:
Download:
Share:
 
Abstract:
我们将会讨论如何利用 GPU 加速金融领域的大数据图计算的方法和案例,并且分享通过 GPU 提升机器学习与数据分析效率和性能的经验。包括使用 NVIDIA Rapids 机器学习计算平台,在 GPU 上实现快速的机器学习建模和图数据分析计算,从而缩短数十倍的异常与风险检测分析的时间。本次演讲还会介绍利用 cuSparse 进行稀疏神经网络训练推理加速的实际案例,大幅提升金融领域的数据分析的效率,并根据我们的经验为其他数据科学家提供建议。 ...Read More
Abstract:
我们将会讨论如何利用 GPU 加速金融领域的大数据图计算的方法和案例,并且分享通过 GPU 提升机器学习与数据分析效率和性能的经验。包括使用 NVIDIA Rapids 机器学习计算平台,在 GPU 上实现快速的机器学习建模和图数据分析计算,从而缩短数十倍的异常与风险检测分析的时间。本次演讲还会介绍利用 cuSparse 进行稀疏神经网络训练推理加速的实际案例,大幅提升金融领域的数据分析的效率,并根据我们的经验为其他数据科学家提供建议。  Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9100
Share:
 
Abstract:
演讲分为两部分。第一部分,我们将说明 NVIDIA 的新开源数据科学平台 RAPIDS 如何推动数据科学的发展。与会者将学习如何利用开源库在 GPU 上实现更快的性能和更轻松的开发,并了解我们最新的工作和新功能。我们将介绍 RAPIDS 中的每个组件,并说明如何轻松上手。 在第二部分, 我们将展示通过结合 Dask 以及 XGBoost 将梯度提升模型的训练拓展至 GPU 集群上, 从而获得高效的模型训练方法。 ...Read More
Abstract:
演讲分为两部分。第一部分,我们将说明 NVIDIA 的新开源数据科学平台 RAPIDS 如何推动数据科学的发展。与会者将学习如何利用开源库在 GPU 上实现更快的性能和更轻松的开发,并了解我们最新的工作和新功能。我们将介绍 RAPIDS 中的每个组件,并说明如何轻松上手。 在第二部分, 我们将展示通过结合 Dask 以及 XGBoost 将梯度提升模型的训练拓展至 GPU 集群上, 从而获得高效的模型训练方法。   Back
 
Topics:
HPC and Supercomputing
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9949
Streaming:
Download:
Share:
Intelligent Machines, IoT & Robotics
Presentation
Media
Abstract:
本次演讲,我们将介绍NVIDIA机器人平台的两名新成员:Isaac Sim for Manipulation 和PhysX 5.0。前半部我们将介绍机器人模拟器:Isaac Sim for Manipulation。机器人在现实世界中犯的错误既昂贵又危险,因此,学术界和商业界都迫切需要一个逼真的模拟器。Isaac Sim 在Omniverse Kit中增加了模拟机器人需要的技术。Omniverse 里的RTX技术和PhysX引擎使本模拟器比现有的模拟器更具真实感和物理准确性。明年出版的版本将专注于机器人手操纵。后半部我们将深入介绍PhysX 5.0的进展。最近,PhysX团队将研究重点转向了高保真物理模拟,在PhysX 4.0中引入了新的TGS解算器以及基于约化坐标的关节系统,同时满足了游戏领域和机器人领域的不同需求。PhysX 5.0版本会集成基于约束的粒子模拟技术,支持离散粒子,液体,布料,充气体,质点弹簧系统,以及基于形状匹配约束的伪刚体和塑性体的模拟。新的版本也将增加基于共旋有限元方法模型的软体模拟技术,并支持上述所有新特性之间以及它们与刚体之间的无缝交互。 ...Read More
Abstract:
本次演讲,我们将介绍NVIDIA机器人平台的两名新成员:Isaac Sim for Manipulation 和PhysX 5.0。前半部我们将介绍机器人模拟器:Isaac Sim for Manipulation。机器人在现实世界中犯的错误既昂贵又危险,因此,学术界和商业界都迫切需要一个逼真的模拟器。Isaac Sim 在Omniverse Kit中增加了模拟机器人需要的技术。Omniverse 里的RTX技术和PhysX引擎使本模拟器比现有的模拟器更具真实感和物理准确性。明年出版的版本将专注于机器人手操纵。后半部我们将深入介绍PhysX 5.0的进展。最近,PhysX团队将研究重点转向了高保真物理模拟,在PhysX 4.0中引入了新的TGS解算器以及基于约化坐标的关节系统,同时满足了游戏领域和机器人领域的不同需求。PhysX 5.0版本会集成基于约束的粒子模拟技术,支持离散粒子,液体,布料,充气体,质点弹簧系统,以及基于形状匹配约束的伪刚体和塑性体的模拟。新的版本也将增加基于共旋有限元方法模型的软体模拟技术,并支持上述所有新特性之间以及它们与刚体之间的无缝交互。  Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9300
Share:
 
Abstract:
基于ISAAC的硬件在环机器人仿真系统。本演讲将探讨如何利用Jetson平台的能力做机器人的数据处理,借助ISAAC做场景仿真和物理仿真, 从而完成物理硬件在环的系统仿真。
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9372
Share:
 
Abstract:
成本居高不下,招工难等问题是物流行业的普遍痛点,极智嘉(GEEK+)致力于为客户提供仓储、工业等领域高投入产出比的智慧物流解决方案和RAAS(Robot As A Service)服务,融合NVIDIA Jetson的强劲算力为客户降本增效。 ...Read More
Abstract:
成本居高不下,招工难等问题是物流行业的普遍痛点,极智嘉(GEEK+)致力于为客户提供仓储、工业等领域高投入产出比的智慧物流解决方案和RAAS(Robot As A Service)服务,融合NVIDIA Jetson的强劲算力为客户降本增效。  Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9133
Share:
 
Abstract:
分享菜鸟ET实验室在自动驾驶计算平台的演进,及这个过程中的思考。自动驾驶是一个极其复杂的系统,如何满足其对计算能力的要求是极大的挑战,功耗和性能如何平衡,工程和算法如何协调,和大家一起探讨。 ...Read More
Abstract:
分享菜鸟ET实验室在自动驾驶计算平台的演进,及这个过程中的思考。自动驾驶是一个极其复杂的系统,如何满足其对计算能力的要求是极大的挑战,功耗和性能如何平衡,工程和算法如何协调,和大家一起探讨。  Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9167
Streaming:
Download:
Share:
 
Abstract:
本演讲将介绍百度基于飞桨(PaddlePaddle)打造的功能完善、开发便捷的AI端计算模型生成平台,Jetson系列是该平台最主要支持的嵌入式硬件方案之一。其中飞桨(PaddlePaddle)是百度开发的中国唯一全面开源开放、功能完备的产业级深度学习平台,EasyDL和EasyEdge分别是百度提供的云上模型训练开发平台和端计算模型生成平台,Jetson是 NVIDIA 嵌入式硬件平台方案的总称。听众将了解到相关方案的设计和实现思路,并了解到相关行业应用案例。 ...Read More
Abstract:
本演讲将介绍百度基于飞桨(PaddlePaddle)打造的功能完善、开发便捷的AI端计算模型生成平台,Jetson系列是该平台最主要支持的嵌入式硬件方案之一。其中飞桨(PaddlePaddle)是百度开发的中国唯一全面开源开放、功能完备的产业级深度学习平台,EasyDL和EasyEdge分别是百度提供的云上模型训练开发平台和端计算模型生成平台,Jetson是 NVIDIA 嵌入式硬件平台方案的总称。听众将了解到相关方案的设计和实现思路,并了解到相关行业应用案例。   Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9331
Share:
 
Abstract:
截止2019年8月,搭载NVIDIA TeslaT4及Xavier服务器的国内领先智能视频分析平台慧眼神瞳(AI Argus)已经在超过100个中转场和分点部进行部署应用,边缘计算服务范围覆盖了全国大部分地区及核心中转枢纽中心。在本次演讲中,我们将重点介绍在物流运输及分拣场景下的车牌识别、装载率检测、违规行为检测等算法。其中,AI Argus推出的PLTS快件全流程跟踪系统通过顺丰全网31万路摄像头视频数据与运作员巴枪操作进行匹配,定位快件在每个操作节点的情况。通过工业相机采集快件高清图片,进行外包装破损、外包装更换和不合规贴纸的智能检测,对穿透性破损、湿损、皱褶/压痕有显著检测结果。团队将进一步开发研究基于T4和Xavier的产品性能指标。预计未来一年,AI Argus将部署数千个边缘服务器,成为中国物流领域第一个真正的大型边缘计算平台。 ...Read More
Abstract:
截止2019年8月,搭载NVIDIA TeslaT4及Xavier服务器的国内领先智能视频分析平台慧眼神瞳(AI Argus)已经在超过100个中转场和分点部进行部署应用,边缘计算服务范围覆盖了全国大部分地区及核心中转枢纽中心。在本次演讲中,我们将重点介绍在物流运输及分拣场景下的车牌识别、装载率检测、违规行为检测等算法。其中,AI Argus推出的PLTS快件全流程跟踪系统通过顺丰全网31万路摄像头视频数据与运作员巴枪操作进行匹配,定位快件在每个操作节点的情况。通过工业相机采集快件高清图片,进行外包装破损、外包装更换和不合规贴纸的智能检测,对穿透性破损、湿损、皱褶/压痕有显著检测结果。团队将进一步开发研究基于T4和Xavier的产品性能指标。预计未来一年,AI Argus将部署数千个边缘服务器,成为中国物流领域第一个真正的大型边缘计算平台。  Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9447
Share:
 
Abstract:
本演讲将介绍京东无人驾驶团队在无人配送机器人感知系统设计上的实践与经验。京东无人配送机器人面向电商物流配送场景,力图解决最后一公里配送问题。京东无人配送机器人通过雷达和图像传感器实现360度环境监测,能够自动规避道路障碍与车辆行人,准确识别红绿灯信号,自主停靠配送点,做到了自动化配送的全场景适应。感知系统是配送机器人的眼睛,提供车辆周围的障碍物、信号灯等信息。本演讲将从感知架构,核心算法原理,Jetson端部署等角度,全面介绍感知系统的核心知识。 ...Read More
Abstract:
本演讲将介绍京东无人驾驶团队在无人配送机器人感知系统设计上的实践与经验。京东无人配送机器人面向电商物流配送场景,力图解决最后一公里配送问题。京东无人配送机器人通过雷达和图像传感器实现360度环境监测,能够自动规避道路障碍与车辆行人,准确识别红绿灯信号,自主停靠配送点,做到了自动化配送的全场景适应。感知系统是配送机器人的眼睛,提供车辆周围的障碍物、信号灯等信息。本演讲将从感知架构,核心算法原理,Jetson端部署等角度,全面介绍感知系统的核心知识。  Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9121
Share:
 
Abstract:
人工智能正在使以前只出现在科幻小说中的应用变为现实,并且正在影响了几乎每一个行业。自主机器正是利用人工智能来解决世界上最棘手的问题。 NVIDIA 的 Jetson 平台为您提供了在机器人、无人机,以及其他自主机器上开发和部署人工智能的工具和平台。本演讲将为您介绍 Jetson 平台的最新进展以及特性。 ...Read More
Abstract:
人工智能正在使以前只出现在科幻小说中的应用变为现实,并且正在影响了几乎每一个行业。自主机器正是利用人工智能来解决世界上最棘手的问题。 NVIDIA 的 Jetson 平台为您提供了在机器人、无人机,以及其他自主机器上开发和部署人工智能的工具和平台。本演讲将为您介绍 Jetson 平台的最新进展以及特性。   Back
 
Topics:
Intelligent Machines, IoT & Robotics
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9788
Streaming:
Download:
Share:
Professional Visualisation
Presentation
Media
Abstract:
新的 NVIDIA CloudXR 软件开发套件基于 NVIDIA GPU 技术,可帮助企业从基于 OpenVR 接口的任何应用程序创建和提供高质量的无线 AR 和 VR 体验(包括平板电脑,手机,VR 头盔和 AR 眼镜等等)。 借助 NVIDIA CloudXR,用户无需物理绑定到高性能计算机即可驱动丰富的沉浸式环境。该 SDK 运行在云或本地 NVIDIA 服务器上,可提供虚拟,增强或混合现实环境(统称为 XR)所需的高级图形性能。 使用 NVIDIA CloudXR从本地数据中心传输串流沉浸式内容。电信运营商,软件制造商和设备制造商可以受益 5G 高带宽和低延迟,为数以百万计的客户提供更高的帧速率,低延迟的沉浸式 XR 体验,而其覆盖范围比以前更大。 ...Read More
Abstract:
新的 NVIDIA CloudXR 软件开发套件基于 NVIDIA GPU 技术,可帮助企业从基于 OpenVR 接口的任何应用程序创建和提供高质量的无线 AR 和 VR 体验(包括平板电脑,手机,VR 头盔和 AR 眼镜等等)。 借助 NVIDIA CloudXR,用户无需物理绑定到高性能计算机即可驱动丰富的沉浸式环境。该 SDK 运行在云或本地 NVIDIA 服务器上,可提供虚拟,增强或混合现实环境(统称为 XR)所需的高级图形性能。 使用 NVIDIA CloudXR从本地数据中心传输串流沉浸式内容。电信运营商,软件制造商和设备制造商可以受益 5G 高带宽和低延迟,为数以百万计的客户提供更高的帧速率,低延迟的沉浸式 XR 体验,而其覆盖范围比以前更大。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9861
Streaming:
Download:
Share:
 
Abstract:
vGPU 虚拟化技术在云上的实施,带来了算力细分与算力多样化,算力的匹配将为用户节省业务成本,同时虚拟化通过对计算资源的控制使得云上 GPU 计算的灵活性,可用性进一步提升;回顾 vGPU 技术的发展历史,阐述其实现基本原理,GPU 作为最难虚拟化的设备,到今天终于可以落地产品化了;vGPU 技术带来的可控性,灵活性为运营维护,资源调度利用提供了便利,也增强了云上 GPU 的使用安全;虚拟化技术以尽可能低的性能损耗实现了算力的切分;腾讯云利用 vGPU 技术在云游戏,智能 AI 平台等方面的使用案例;未来展望 vGPU 技术的新的发展和所带来的价值。 ...Read More
Abstract:
vGPU 虚拟化技术在云上的实施,带来了算力细分与算力多样化,算力的匹配将为用户节省业务成本,同时虚拟化通过对计算资源的控制使得云上 GPU 计算的灵活性,可用性进一步提升;回顾 vGPU 技术的发展历史,阐述其实现基本原理,GPU 作为最难虚拟化的设备,到今天终于可以落地产品化了;vGPU 技术带来的可控性,灵活性为运营维护,资源调度利用提供了便利,也增强了云上 GPU 的使用安全;虚拟化技术以尽可能低的性能损耗实现了算力的切分;腾讯云利用 vGPU 技术在云游戏,智能 AI 平台等方面的使用案例;未来展望 vGPU 技术的新的发展和所带来的价值。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9832
Share:
 
Abstract:
在 2016 年KVM论坛发布 VFIO Mediate Device framework 之后三年中,NVIDIA 勇于创新,孜孜不倦的将更多更完善的 GPU 虚拟化技术带入 Linux KVM 生态,不断为基于 KVM 技术的虚拟数据中心增添活力。在这个讲座中,我们将会介绍定位 NVIDIA CUDA 计算的新 vGPU 产品NVIDIA Virtual Compute Server(vCS),以及专门为 GPU 计算打造的增强型作业调度器, 以及其为私有共有云管理带来的便利。我们还会介绍可以在云计算中提供游戏服务的 NVIDIA vGaming 虚拟游戏产品。我们同时还会介绍这些系列产品的幕后技术细节。我们将介绍目前在 Linux KVM 开源社区中研发讨论的对于 NVIDIA vGPU 热迁移的支持,这将是基于一个可以让所有 VFIO Mediate device 具有热迁移特性的架构。 ...Read More
Abstract:
在 2016 年KVM论坛发布 VFIO Mediate Device framework 之后三年中,NVIDIA 勇于创新,孜孜不倦的将更多更完善的 GPU 虚拟化技术带入 Linux KVM 生态,不断为基于 KVM 技术的虚拟数据中心增添活力。在这个讲座中,我们将会介绍定位 NVIDIA CUDA 计算的新 vGPU 产品NVIDIA Virtual Compute Server(vCS),以及专门为 GPU 计算打造的增强型作业调度器, 以及其为私有共有云管理带来的便利。我们还会介绍可以在云计算中提供游戏服务的 NVIDIA vGaming 虚拟游戏产品。我们同时还会介绍这些系列产品的幕后技术细节。我们将介绍目前在 Linux KVM 开源社区中研发讨论的对于 NVIDIA vGPU 热迁移的支持,这将是基于一个可以让所有 VFIO Mediate device 具有热迁移特性的架构。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9309
Streaming:
Download:
Share:
 
Abstract:
自 NVIDIA RTX 技术及 Turing 系列 GPU 发布以来,实时光线追踪技术越来越流行,同时越来越多的开发者想要学习并在游戏中使用这一技术。在本次演讲中,我们将首先介绍一些实时光线追踪技术的基础知识,包括渲染与光传输理论、光栅化与光线追踪技术的异同点以及当前实时光线追踪技术面临的挑战。随后我们将讲解如何使用最新的 GPU 加速编程接口来构建实时光线追踪系统。最后我们会介绍一些实用的实时光线追踪特效,这些特效可以高效运行在当前 Turing 系列 GPU 上。 ...Read More
Abstract:
自 NVIDIA RTX 技术及 Turing 系列 GPU 发布以来,实时光线追踪技术越来越流行,同时越来越多的开发者想要学习并在游戏中使用这一技术。在本次演讲中,我们将首先介绍一些实时光线追踪技术的基础知识,包括渲染与光传输理论、光栅化与光线追踪技术的异同点以及当前实时光线追踪技术面临的挑战。随后我们将讲解如何使用最新的 GPU 加速编程接口来构建实时光线追踪系统。最后我们会介绍一些实用的实时光线追踪特效,这些特效可以高效运行在当前 Turing 系列 GPU 上。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9530
Streaming:
Download:
Share:
 
Abstract:
在本次演讲中我们将向大家介绍一种高效灵活的光线追踪全局光照技术。这种技术对标准的静态光探头技术进行了升级,解决了漏光问题并且进行了效率提升,从而可以在任何现代 GPU 上用光线追踪进行实时动态更新。通过使用这种技术可以简化美术的工作,提高渲染质量,放宽游戏中的光照限制。我们在演讲中介绍此技术时还会同时介绍一些新的实现细节。通过这些新的实现方法我们可以提高性能及获得更高的画面质量。最后我们还将探讨一下此技术的一些应用前景。 ...Read More
Abstract:
在本次演讲中我们将向大家介绍一种高效灵活的光线追踪全局光照技术。这种技术对标准的静态光探头技术进行了升级,解决了漏光问题并且进行了效率提升,从而可以在任何现代 GPU 上用光线追踪进行实时动态更新。通过使用这种技术可以简化美术的工作,提高渲染质量,放宽游戏中的光照限制。我们在演讲中介绍此技术时还会同时介绍一些新的实现细节。通过这些新的实现方法我们可以提高性能及获得更高的画面质量。最后我们还将探讨一下此技术的一些应用前景。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9500
Streaming:
Download:
Share:
 
Abstract:
如何对渲染进行优化一直是困扰开发者的问题,即便对于资深的开发人员也始终是个挑战。本演讲将向开发者介绍英伟达的工具 NVIDIA® Nsight™ Graphics,此工具支持各种现有的图形 API,能有效帮助开发者对渲染进行调试分析及输出渲染帧。同时结合此工具,我们还将向开发者介绍一个我们称之为 P3 (Peak-Performance-Percentage) 的分析方法,此方法可以让开发者使用英伟达特定硬件指标来判断 GPU 任务瓶。并且此演讲中我们还会针对英伟达 RTX 特性的使用给出优化建议。 ...Read More
Abstract:
如何对渲染进行优化一直是困扰开发者的问题,即便对于资深的开发人员也始终是个挑战。本演讲将向开发者介绍英伟达的工具 NVIDIA® Nsight™ Graphics,此工具支持各种现有的图形 API,能有效帮助开发者对渲染进行调试分析及输出渲染帧。同时结合此工具,我们还将向开发者介绍一个我们称之为 P3 (Peak-Performance-Percentage) 的分析方法,此方法可以让开发者使用英伟达特定硬件指标来判断 GPU 任务瓶。并且此演讲中我们还会针对英伟达 RTX 特性的使用给出优化建议。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9594
Streaming:
Download:
Share:
 
Abstract:
作为全球首款使用 Vulkan Ray tracing 实现实时光线追踪技术的游戏,《剑网三》全面集成了 NVIDIA RTX 技术,并实现了物理真实的反射效果、大范围焦散效果,以及次序完全正确的半透明混合效果,极大地提升了游戏画质。本讲座将介绍以下内容 :Vulkan Ray Tracing 的使用介绍、与 DirectX Ray tracing 的差别、 如何将 Vulkan Raytracing 集成至《剑网三》引擎中以及一些实用的建议。最后我们会为大家详细讲解游戏中已有的光线追踪特效实现方案,以及性能调优过程 ...Read More
Abstract:
作为全球首款使用 Vulkan Ray tracing 实现实时光线追踪技术的游戏,《剑网三》全面集成了 NVIDIA RTX 技术,并实现了物理真实的反射效果、大范围焦散效果,以及次序完全正确的半透明混合效果,极大地提升了游戏画质。本讲座将介绍以下内容 :Vulkan Ray Tracing 的使用介绍、与 DirectX Ray tracing 的差别、 如何将 Vulkan Raytracing 集成至《剑网三》引擎中以及一些实用的建议。最后我们会为大家详细讲解游戏中已有的光线追踪特效实现方案,以及性能调优过程  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9421
Streaming:
Download:
Share:
 
Abstract:
《重生边缘》,英文名 SYNCED: Off-Planet,是腾讯 NExT工作室正在研发的一款大型多人在线 AAA 级别多人在线网游。该游戏使用虚幻 4 引擎进行制作,将会全面支持 NVIDIA 的实时光线追踪技术,包括反射和阴影效果,画面表现达到了同类型游戏中较高的美术水准。本讲座将结合实际游戏研发,介绍 RTX 在材质上的表现;材质优化的具体办法;以及 RTX 技术在虚幻 4 引擎框架中的实现方式;支持了哪些实时渲染功能;以及遇到了哪些技术问题,并通过什么手段解决了。 ...Read More
Abstract:
《重生边缘》,英文名 SYNCED: Off-Planet,是腾讯 NExT工作室正在研发的一款大型多人在线 AAA 级别多人在线网游。该游戏使用虚幻 4 引擎进行制作,将会全面支持 NVIDIA 的实时光线追踪技术,包括反射和阴影效果,画面表现达到了同类型游戏中较高的美术水准。本讲座将结合实际游戏研发,介绍 RTX 在材质上的表现;材质优化的具体办法;以及 RTX 技术在虚幻 4 引擎框架中的实现方式;支持了哪些实时渲染功能;以及遇到了哪些技术问题,并通过什么手段解决了。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9819
Streaming:
Download:
Share:
 
Abstract:
通过学习使用图灵架构显卡关于网格着色器以及可变比例着色新特性,提高对于复杂场景的渲染效率。本次演讲将通过介绍 Nvidia Asteriods 样例的实现细节来介绍网格着色器的使用。通过使用网格着色器可以大幅提高显卡对于图元的处理能力,为渲染场景提供更加逼真细节更为丰富的模型。使用可变比例着色技术可以自定义对于屏幕空间区域渲染的精细程度,降低非关键部分渲染像素数量,进一步提高渲染效率。 ...Read More
Abstract:
通过学习使用图灵架构显卡关于网格着色器以及可变比例着色新特性,提高对于复杂场景的渲染效率。本次演讲将通过介绍 Nvidia Asteriods 样例的实现细节来介绍网格着色器的使用。通过使用网格着色器可以大幅提高显卡对于图元的处理能力,为渲染场景提供更加逼真细节更为丰富的模型。使用可变比例着色技术可以自定义对于屏幕空间区域渲染的精细程度,降低非关键部分渲染像素数量,进一步提高渲染效率。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9634
Streaming:
Download:
Share:
 
Abstract:
本演讲内容将涵盖: 1. 介绍在虚幻 4 引擎中的 RTX 特性,展示 RTX 这些特性分别对应的效果是怎么样的。 2. 如何针对游戏制作 RTX 效果并突出视觉特性,介绍目前现有的 3A 游戏他们所使用了什么特性和效果,举例如何利用 RTX 反射制作一款创新型游戏,演示光明记忆所使用的 RTX 效果和设计思路。 3.如何在游戏中优化 RTX 帧率,在虚幻 4 引擎中修改哪些参数可以优化 RTX 下的游戏帧率,以及优化手段等等。 ...Read More
Abstract:
本演讲内容将涵盖: 1. 介绍在虚幻 4 引擎中的 RTX 特性,展示 RTX 这些特性分别对应的效果是怎么样的。 2. 如何针对游戏制作 RTX 效果并突出视觉特性,介绍目前现有的 3A 游戏他们所使用了什么特性和效果,举例如何利用 RTX 反射制作一款创新型游戏,演示光明记忆所使用的 RTX 效果和设计思路。 3.如何在游戏中优化 RTX 帧率,在虚幻 4 引擎中修改哪些参数可以优化 RTX 下的游戏帧率,以及优化手段等等。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9688
Streaming:
Download:
Share:
 
Abstract:
基于 NVIDIA OptiX 框架, Arnold 渲染器利用 NVIDIA RTX 技术, 将光线追踪渲染,无缝移植到 GPU 流程中,包括 shading networks, OSL shader, SSS 效果,OpenVDB 体积云,Instances operators, light Path Expressions, shader API 等,实现高速高质量的渲染效果。 ...Read More
Abstract:
基于 NVIDIA OptiX 框架, Arnold 渲染器利用 NVIDIA RTX 技术, 将光线追踪渲染,无缝移植到 GPU 流程中,包括 shading networks, OSL shader, SSS 效果,OpenVDB 体积云,Instances operators, light Path Expressions, shader API 等,实现高速高质量的渲染效果。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9568
Streaming:
Download:
Share:
 
Abstract:
讲述使用 NVIDIA RTX 显卡,在云端实时渲染高精度的三维模型,再利用串流技术将渲染后的画面,通过互联网发送到用户端,极大减轻了用户终端的计算负担,实现终端轻量化与高效能兼顾。 随着 5G 技术的应用,互联网的延时进一步降低,云端的渲染结果的呈现延时也将进一步降低,云端渲染可能会是一种面向未来的图形计算计算架构,甚至所有的三维图形设计工作,都可以放在云端运行。 利用 NVIDIA 的 vGPU 技术,可以针对不同的应用,指派不同的 vGPU颗粒度,实现计算资源利用率的最大化,所以云端渲染会是一种经济适用的架构。 ...Read More
Abstract:
讲述使用 NVIDIA RTX 显卡,在云端实时渲染高精度的三维模型,再利用串流技术将渲染后的画面,通过互联网发送到用户端,极大减轻了用户终端的计算负担,实现终端轻量化与高效能兼顾。 随着 5G 技术的应用,互联网的延时进一步降低,云端的渲染结果的呈现延时也将进一步降低,云端渲染可能会是一种面向未来的图形计算计算架构,甚至所有的三维图形设计工作,都可以放在云端运行。 利用 NVIDIA 的 vGPU 技术,可以针对不同的应用,指派不同的 vGPU颗粒度,实现计算资源利用率的最大化,所以云端渲染会是一种经济适用的架构。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9773
Streaming:
Download:
Share:
 
Abstract:
介绍 NVIDIA RTX 技术在 Unreal 4.23 版本中的光线追踪的技术应用,演示具有电影品质的游戏动画,高质量产品广告等实时光线跟踪渲染的案例和技术。将虚幻引擎的技术与实时光线追踪(RTX)相结合,创作出在基于实时光照效果上能够与许多脱机渲染器相媲美的高质量交互式体验。实时光线追踪可以让影像看起来更自然,真实,实时可交互,将大幅改善 CG 产品制作效率,与传统脱机渲染相比有着巨大的优势。 ...Read More
Abstract:
介绍 NVIDIA RTX 技术在 Unreal 4.23 版本中的光线追踪的技术应用,演示具有电影品质的游戏动画,高质量产品广告等实时光线跟踪渲染的案例和技术。将虚幻引擎的技术与实时光线追踪(RTX)相结合,创作出在基于实时光照效果上能够与许多脱机渲染器相媲美的高质量交互式体验。实时光线追踪可以让影像看起来更自然,真实,实时可交互,将大幅改善 CG 产品制作效率,与传统脱机渲染相比有着巨大的优势。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9404
Streaming:
Download:
Share:
 
Abstract:
DaVinci Resolve 是备受好莱坞电影、电视连续剧和商业广告青睐的后期制作解决方案。从最早的 7.0(2010 年)开始即采用基于 NVIDIA CUDA 加速解决方案,可以支持多 GPU 并行运算,最多支持 8 颗 GPU 来加速后期制作实时性,时至今日已经升级到 16 版本,成为一款在同一个软件工具中将专业 8K 剪辑、调色、视觉特效和音频后期制作融于一身的解决方案!并且首次加入了 DaVinci Neural Engine 神经网络引擎使用先进的深度神经网络和学习机制,并以人工智能驱动众多新功能,使用 RTX GPU 创新技术实现 AI 和深度学习,满足从 4K 到 8K,从 SDR 到 HDR 制作能力,为您重构世界提供强劲动力。 ...Read More
Abstract:
DaVinci Resolve 是备受好莱坞电影、电视连续剧和商业广告青睐的后期制作解决方案。从最早的 7.0(2010 年)开始即采用基于 NVIDIA CUDA 加速解决方案,可以支持多 GPU 并行运算,最多支持 8 颗 GPU 来加速后期制作实时性,时至今日已经升级到 16 版本,成为一款在同一个软件工具中将专业 8K 剪辑、调色、视觉特效和音频后期制作融于一身的解决方案!并且首次加入了 DaVinci Neural Engine 神经网络引擎使用先进的深度神经网络和学习机制,并以人工智能驱动众多新功能,使用 RTX GPU 创新技术实现 AI 和深度学习,满足从 4K 到 8K,从 SDR 到 HDR 制作能力,为您重构世界提供强劲动力。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9270
Streaming:
Download:
Share:
 
Abstract:
Mosaic 多屏拼接技术是 NVIDIA Quadro 显卡特有的,并且在很多行业行业中实现超高分辨都有应用(8K 16K),但是在实际项目部署当中,多 GPU 的负载均衡一直是开发者比较头疼的一个问题。 本次演讲我们将介绍多用方法去优化多 GPU 环境下的渲染和视频播放,结合NVIDIA 的 OPENGLmulticast 扩展,CUDA 技术和 NVIDIA Codec 技术 ...Read More
Abstract:
Mosaic 多屏拼接技术是 NVIDIA Quadro 显卡特有的,并且在很多行业行业中实现超高分辨都有应用(8K 16K),但是在实际项目部署当中,多 GPU 的负载均衡一直是开发者比较头疼的一个问题。 本次演讲我们将介绍多用方法去优化多 GPU 环境下的渲染和视频播放,结合NVIDIA 的 OPENGLmulticast 扩展,CUDA 技术和 NVIDIA Codec 技术  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9492
Streaming:
Download:
Share:
 
Abstract:
带您了解最新视觉效果增强技术在影视行业的最新应用。我们研发的视觉增强技术,已经应用在多部影视作品的制作之中,并让大量珍贵的历史资料焕发新颜。在本场演讲中,我们给您展现让诸如”开国大典“等珍贵资料焕发新颜的 AI 视觉技术、讲解多部重磅影片制作的幕后故事、领略 8K 甚至 16K VR 和 CG 制作的新貌。最后我们也会向您介绍我们是如何在 Quadro RTX Tensor Core 的支持下完成相关深度学习的训练和生产的底层技术。 ...Read More
Abstract:
带您了解最新视觉效果增强技术在影视行业的最新应用。我们研发的视觉增强技术,已经应用在多部影视作品的制作之中,并让大量珍贵的历史资料焕发新颜。在本场演讲中,我们给您展现让诸如”开国大典“等珍贵资料焕发新颜的 AI 视觉技术、讲解多部重磅影片制作的幕后故事、领略 8K 甚至 16K VR 和 CG 制作的新貌。最后我们也会向您介绍我们是如何在 Quadro RTX Tensor Core 的支持下完成相关深度学习的训练和生产的底层技术。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9279
Streaming:
Download:
Share:
 
Abstract:
通过 PBR 程序化纹理以及扫描模型库通不同的面数预设与跨引擎支持,将打通 CG 行业从前期预制作至后期制作的整体流程。配合云端算力与 5G, 给个体工作室以及各类商业公司全新的工作开发全新流程和创作可能。艺术家将可以通过游戏引擎和英伟达光线追踪技术,快速实现虚拟真实布景并且得到实时渲染,并且可以通过 AI 学习,将扫描的数字资产风格化,得到自己独一无二的艺术效果。同时该流程可以全方位结算项目的交接成本,经费以及开发周期,让 CG 行业得以真正朝向 5G 下的全新工业化。 ...Read More
Abstract:
通过 PBR 程序化纹理以及扫描模型库通不同的面数预设与跨引擎支持,将打通 CG 行业从前期预制作至后期制作的整体流程。配合云端算力与 5G, 给个体工作室以及各类商业公司全新的工作开发全新流程和创作可能。艺术家将可以通过游戏引擎和英伟达光线追踪技术,快速实现虚拟真实布景并且得到实时渲染,并且可以通过 AI 学习,将扫描的数字资产风格化,得到自己独一无二的艺术效果。同时该流程可以全方位结算项目的交接成本,经费以及开发周期,让 CG 行业得以真正朝向 5G 下的全新工业化。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9665
Streaming:
Download:
Share:
 
Abstract:
本次演讲将讨论视觉计算技术的进步如何改变产品和建筑设计工作流程。 面向建筑,工程,施工行业(AEC)和制造行业的公司一直在寻找方法来优化设计工作流程并更快地完成项目。工程仿真,虚拟现实,实时光线跟踪和图形虚拟化方面的重点突破使公司能够加速设计流程,同时有助于推动设计创新。参会者将了解这些技术给世界各地的设计团队带来的好处。 ...Read More
Abstract:
本次演讲将讨论视觉计算技术的进步如何改变产品和建筑设计工作流程。 面向建筑,工程,施工行业(AEC)和制造行业的公司一直在寻找方法来优化设计工作流程并更快地完成项目。工程仿真,虚拟现实,实时光线跟踪和图形虚拟化方面的重点突破使公司能够加速设计流程,同时有助于推动设计创新。参会者将了解这些技术给世界各地的设计团队带来的好处。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9811
Streaming:
Download:
Share:
 
Abstract:
实时光线追踪技术构建在 Unity 的高清渲染管线(HDRP)和 NVIDIA RTX 技术之上,更进一步释放了实时渲染的新潜力,带来了更加逼真的画面效果。本次演讲将为大家详细介绍其中的原理以及如何通过 Unity 实时光线追踪技术对画质进行全面提升。 ...Read More
Abstract:
实时光线追踪技术构建在 Unity 的高清渲染管线(HDRP)和 NVIDIA RTX 技术之上,更进一步释放了实时渲染的新潜力,带来了更加逼真的画面效果。本次演讲将为大家详细介绍其中的原理以及如何通过 Unity 实时光线追踪技术对画质进行全面提升。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9955
Streaming:
Download:
Share:
 
Abstract:
随着工业 4.0 时代到来,产品制造商正在引入大量前沿技术,从而减少成本、优化产品、加快开发周期,并提高项目团队的工作效率。Quadro RTX 技术包括虚拟现实 (VR)、逼真渲染、实时工程模拟、图形虚拟化和人工智能 (AI)。在 Quadro RTX 技术的加持下,制造商便能创建先进的产品设计流程,从而打造独具特色的创新产品,并保持竞争力。 ...Read More
Abstract:
随着工业 4.0 时代到来,产品制造商正在引入大量前沿技术,从而减少成本、优化产品、加快开发周期,并提高项目团队的工作效率。Quadro RTX 技术包括虚拟现实 (VR)、逼真渲染、实时工程模拟、图形虚拟化和人工智能 (AI)。在 Quadro RTX 技术的加持下,制造商便能创建先进的产品设计流程,从而打造独具特色的创新产品,并保持竞争力。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9753
Streaming:
Download:
Share:
 
Abstract:
光线追踪技术对于设计和工程阶段的加速有着很大的推动作用, 达索系统利用 3D 体验平台, 结合 Turing 架构先进的光线追踪技术, 除大幅度加速工业设计阶段的进程,更实时地为设计师提供以前基于传统运算手段需要长时间等待的可视化结果。设计师将更多精力投入于创作中,GPU 则负责设计意图的高效转化。 ...Read More
Abstract:
光线追踪技术对于设计和工程阶段的加速有着很大的推动作用, 达索系统利用 3D 体验平台, 结合 Turing 架构先进的光线追踪技术, 除大幅度加速工业设计阶段的进程,更实时地为设计师提供以前基于传统运算手段需要长时间等待的可视化结果。设计师将更多精力投入于创作中,GPU 则负责设计意图的高效转化。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9682
Streaming:
Download:
Share:
 
Abstract:
建筑 BIM 设计已经在不同层面展开,不同软硬件的配置对现有建筑设计表现效率的影响越来越重要,通过软硬件合理的配置并与设计流程的优化整合形成能大幅提高设计效率的最优配置;为传统平面设计方式向信息化三维设计整体转型提供足够的数据依据和支撑并形成一系列的 BIM 正向设计的工作流。 ...Read More
Abstract:
建筑 BIM 设计已经在不同层面展开,不同软硬件的配置对现有建筑设计表现效率的影响越来越重要,通过软硬件合理的配置并与设计流程的优化整合形成能大幅提高设计效率的最优配置;为传统平面设计方式向信息化三维设计整体转型提供足够的数据依据和支撑并形成一系列的 BIM 正向设计的工作流。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9692
Streaming:
Download:
Share:
 
Abstract:
我会在演讲中讲述我们作为一个初创公司,是如何基于 RTX 技术在渲染质量和渲染速度上击败现有方案,为 AEC 行业带来一款全新的实时可视化产品。以及我们如何在可视化工具的基础上,从空间设计师的工作流出发,重塑了一个更好的渲染协作生态。 ...Read More
Abstract:
我会在演讲中讲述我们作为一个初创公司,是如何基于 RTX 技术在渲染质量和渲染速度上击败现有方案,为 AEC 行业带来一款全新的实时可视化产品。以及我们如何在可视化工具的基础上,从空间设计师的工作流出发,重塑了一个更好的渲染协作生态。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9102
Share:
 
Abstract:
本次演讲主要分享在工业领域中的一些渲染案例和 GPU 对大场景渲染的能力支持。首先,会介绍汽车用户案例,通过环境光遮蔽渲染技术完成在沉浸式环境中的渲染处理,在 P6000 或 RTX8000 的高性能显卡的支持下,达到预期成果。其次,介绍船舶用户案例,主要针对大场景/整船模型(原始数据量在 20G 以上)的漫游和实时光线追踪渲染介绍。最后会通过一个案例,介绍软件中的三种渲染方式产生的不同效果。在案例介绍完成后,会通过一些数据和资料,介绍 GPU 对于工程领域用户的帮助。 ...Read More
Abstract:
本次演讲主要分享在工业领域中的一些渲染案例和 GPU 对大场景渲染的能力支持。首先,会介绍汽车用户案例,通过环境光遮蔽渲染技术完成在沉浸式环境中的渲染处理,在 P6000 或 RTX8000 的高性能显卡的支持下,达到预期成果。其次,介绍船舶用户案例,主要针对大场景/整船模型(原始数据量在 20G 以上)的漫游和实时光线追踪渲染介绍。最后会通过一个案例,介绍软件中的三种渲染方式产生的不同效果。在案例介绍完成后,会通过一些数据和资料,介绍 GPU 对于工程领域用户的帮助。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9259
Streaming:
Download:
Share:
 
Abstract:
从视频分析到将人们与相关内容联系起来,人工智能已经对媒体和娱乐行业产生了重大影响。现在,人工智能承诺通过减少重复性的劳动密集型任务,将时间和控制权交还给艺术家,从而加快电影、电视和 VR 的生产流水线。但是未来会怎样呢?人工智能有能力模仿人类的创造力吗?加入这个课程来学习人工智能是如何工作的,以及这种转换技术将如何影响未来的内容创作。 ...Read More
Abstract:
从视频分析到将人们与相关内容联系起来,人工智能已经对媒体和娱乐行业产生了重大影响。现在,人工智能承诺通过减少重复性的劳动密集型任务,将时间和控制权交还给艺术家,从而加快电影、电视和 VR 的生产流水线。但是未来会怎样呢?人工智能有能力模仿人类的创造力吗?加入这个课程来学习人工智能是如何工作的,以及这种转换技术将如何影响未来的内容创作。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9642
Streaming:
Download:
Share:
 
Abstract:
消费级视频包括长视频、短视频、直播等多种类型,其中蕴含着海量的信息和巨大的潜在商业价值。如何运用 GPU 的强大算力,设计人工智能算法,对消费级视频中的内容语义进行分析识别,生成结构化数据,同时受到了学术界和工业界的重视。本次报告将从数据、算法、应用等方面介绍消费级视频分析在实际产业中的尝试。所介绍的系统自去年起已经为海量视频生成了海量标签,并服务于超过 10 类产业的逾百家品牌。 ...Read More
Abstract:
消费级视频包括长视频、短视频、直播等多种类型,其中蕴含着海量的信息和巨大的潜在商业价值。如何运用 GPU 的强大算力,设计人工智能算法,对消费级视频中的内容语义进行分析识别,生成结构化数据,同时受到了学术界和工业界的重视。本次报告将从数据、算法、应用等方面介绍消费级视频分析在实际产业中的尝试。所介绍的系统自去年起已经为海量视频生成了海量标签,并服务于超过 10 类产业的逾百家品牌。  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9397
Streaming:
Download:
Share:
 
Abstract:
我们将现场演示 NVIDIA 数据科学工作站用于纽约出租车费的实时预测案例分析。通过获取上下车地点的历史数据,产生的费用,针对该费用进行训练,然后根据该经过训练的数据集,预测未来的车费。这套方法可以很容易地应用于医疗保健,金融服务,零售等数据集中的任何类似的后勤数据,或者实际上是任何 2D 数据。 NVIDIA 数据科学工作者与其他轻量级数据挖掘终端设备的不同之处在于,您可以使用更大的 sand box 的尺寸以及加速 10 倍以上的结果生成时间! ...Read More
Abstract:
我们将现场演示 NVIDIA 数据科学工作站用于纽约出租车费的实时预测案例分析。通过获取上下车地点的历史数据,产生的费用,针对该费用进行训练,然后根据该经过训练的数据集,预测未来的车费。这套方法可以很容易地应用于医疗保健,金融服务,零售等数据集中的任何类似的后勤数据,或者实际上是任何 2D 数据。 NVIDIA 数据科学工作者与其他轻量级数据挖掘终端设备的不同之处在于,您可以使用更大的 sand box 的尺寸以及加速 10 倍以上的结果生成时间!  Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9564
Streaming:
Download:
Share:
 
Abstract:
VR 技术一直被认为是未来的交互界面。随着 GPU 性能日新月异的提升,AI 等技术的加持,VR 将会被探索出更多可能。HTC Vive 长期致力于研究和揭示这种无限的可能性,我们相信,通过更大空间、更自然的交互、Mixed Reality、云渲染等功能,XR 将有美好的未来。演讲内容会覆盖眼睛追踪,手识别技术,语音识别,BCI,全身追踪,触觉反馈,物体追踪,大空间 MR 技术,我们会宣布我们的 UX 开发者大赛和 PC Streaming (使用 NVIDIA SDK 来做的)。 ...Read More
Abstract:
VR 技术一直被认为是未来的交互界面。随着 GPU 性能日新月异的提升,AI 等技术的加持,VR 将会被探索出更多可能。HTC Vive 长期致力于研究和揭示这种无限的可能性,我们相信,通过更大空间、更自然的交互、Mixed Reality、云渲染等功能,XR 将有美好的未来。演讲内容会覆盖眼睛追踪,手识别技术,语音识别,BCI,全身追踪,触觉反馈,物体追踪,大空间 MR 技术,我们会宣布我们的 UX 开发者大赛和 PC Streaming (使用 NVIDIA SDK 来做的)。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9486
Share:
 
Abstract:
介绍 NVIDIA Turing 架构 GPU、实时光线追踪和 AI 技术在 VR 上的应用,列举应用场景并详述所用到的 NVIDIA 具体技术。内容包括并不仅限于 Turing 架构 GPU 整数与浮点运算并行对渲染性能提升,实时光线追踪为 VR 带来的革新和实现方式,VRS 可变码率渲染在注视点渲染的应用和神经网络在 3D 模型重建应用的降噪实现。 ...Read More
Abstract:
介绍 NVIDIA Turing 架构 GPU、实时光线追踪和 AI 技术在 VR 上的应用,列举应用场景并详述所用到的 NVIDIA 具体技术。内容包括并不仅限于 Turing 架构 GPU 整数与浮点运算并行对渲染性能提升,实时光线追踪为 VR 带来的革新和实现方式,VRS 可变码率渲染在注视点渲染的应用和神经网络在 3D 模型重建应用的降噪实现。   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9596
Streaming:
Download:
Share:
 
Abstract:
编舞术是设计舞蹈动作的一种艺术。在制作音乐舞蹈游戏过程中,会涉及两类工作:1)动捕舞蹈动作片段 2)基于歌曲的节奏、韵律以及情感,艺术化地编排舞蹈动作片段。传统的制作流程依赖专业的编舞师及舞蹈演员,需要花费大量的时间在编舞细节上,使音乐舞蹈游戏制作过程耗时耗力。 我们提出新颖的自动舞蹈匹配系统,能够充分利用GPU训练神经网络,学习大量的在线编舞视频来完成自动化的编舞工作。受到 Motion Matching 以及 Phase Function Neural Network(PFNN)的启发,所介绍系统能够根据输入音频,自动化地分析、分割、匹配预录制舞蹈动作数据。系统能够通过逐段地解析音乐特征,进而利用音乐-动作特征转译神经网络和舞蹈动作特征曲线的生成。这些特征被用于进行基于 Phase 的舞蹈动作特征匹配来构造新的编舞序列。在系统编舞结果的基础上,我们还给艺术家们提供了可以手动修改编舞结果的接口; ...Read More
Abstract:
编舞术是设计舞蹈动作的一种艺术。在制作音乐舞蹈游戏过程中,会涉及两类工作:1)动捕舞蹈动作片段 2)基于歌曲的节奏、韵律以及情感,艺术化地编排舞蹈动作片段。传统的制作流程依赖专业的编舞师及舞蹈演员,需要花费大量的时间在编舞细节上,使音乐舞蹈游戏制作过程耗时耗力。 我们提出新颖的自动舞蹈匹配系统,能够充分利用GPU训练神经网络,学习大量的在线编舞视频来完成自动化的编舞工作。受到 Motion Matching 以及 Phase Function Neural Network(PFNN)的启发,所介绍系统能够根据输入音频,自动化地分析、分割、匹配预录制舞蹈动作数据。系统能够通过逐段地解析音乐特征,进而利用音乐-动作特征转译神经网络和舞蹈动作特征曲线的生成。这些特征被用于进行基于 Phase 的舞蹈动作特征匹配来构造新的编舞序列。在系统编舞结果的基础上,我们还给艺术家们提供了可以手动修改编舞结果的接口;   Back
 
Topics:
Professional Visualisation
Type:
Talk
Event:
GTC China
Year:
2019
Session ID:
CN9423
Streaming:
Download:
Share:
 
 
Previous
  • Amazon Web Services
  • IBM
  • Cisco
  • Dell EMC
  • Hewlett Packard Enterprise
  • Inspur
  • Lenovo
  • SenseTime
  • Supermicro Computers
  • Synnex
  • Autodesk
  • HP
  • Linear Technology
  • MSI Computer Corp.
  • OPTIS
  • PNY
  • SK Hynix
  • vmware
  • Abaco Systems
  • Acceleware Ltd.
  • ASUSTeK COMPUTER INC
  • Cray Inc.
  • Exxact Corporation
  • Flanders - Belgium
  • Google Cloud
  • HTC VIVE
  • Liqid
  • MapD
  • Penguin Computing
  • SAP
  • Sugon
  • Twitter
Next