GTC ON-DEMAND

 
SEARCH SESSIONS
SEARCH SESSIONS

Search All
 
Refine Results:
 
Year(s)

SOCIAL MEDIA

EMAIL SUBSCRIPTION

 
 

GTC ON-DEMAND

Accelerated Data Science
Presentation
Media
使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练
Abstract:
Gradient Boosted Tree 是表格型数据分析的常用算法。 在演讲中,我们将会介绍大数据分析中存在的困难以及机遇。 RAPIDS 开源库同过对 XGBoost 和 Spark 的整合为我们提供了一个端到端的高性能数据处理方案。 通过 GPU 加速我们可以轻松应对快速增长的数据量。 我们将会着重介绍 XGBoost 分布式训练原理,以及如何通过 Spark 和 XGBoost 在 GPU 集群上实现快速的 ETL,模型训练和特征值分析(SHAP value),以相对较低的成本将数小时的运算可以缩至短短的几分钟。 在参与演讲的过程中,您还会了解到 XGBoost 开发的最新信息以及对 XGBoost4j-Spark 加速的未来的展望。 最后我们会展示 GPU 数据分析加速的实现例子以及最新基准测试。
 
Topics:
Accelerated Data Science
Type:
Talk
Event:
GTC China
Year:
2020
Session ID:
CNS20841
Download:
Share: