GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Accelerated Data Science
Presentation
Media
使用 RAPIDS 加速 APACHE SPARK 3.0
Abstract:
作为目前最流行的大数据处理框架,Apache Spark 在其最新的 3.0 版本中加入了对 GPU 设备的调度支持,从而使得数据处理能够被 GPU 加速。演讲首先会介绍 Spark3.0 使用 GPU 加速器 — Spark Rapids Accelerator 所取得的显著成果(时间,花费),并且分析加速器的适用场景和目前的局限性。接着介绍加速器在 Spark 框架中是如何工作的:第一部分是对于 Spark 基础运算部分的加速,第二部分是针对于 Shuffle 数据交换部分的加速。我们会在演讲中进行 demo 来展示实际案例的加速效果。在大部分测试案例中,Spark Rapids Accelerator 取得了至少 3 倍的性能提升。最后,我们会介绍更多的加速特性和后续的开发计划。
 
Topics:
Accelerated Data Science
Type:
Talk
Event:
GTC China
Year:
2020
Session ID:
CNS20960
Download:
Share: