推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

基于Volcano优化机器学习、深度学习的性能

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

成为教练

课程简介

案例背景:
随着Kubernetes的成熟,越来越多的企业把Kubernetes作为AI、大数据、高性能计算的下一代基础设施。然而Kubernetes作为通用解决方案在AI、大数据等专业领域仍然和业务诉求存在一定的差距。主要挑战在调度能力无法满足计算需求、作业管理能力无法满足AI训练的复杂需求、资源管理能力缺少分时共享等等。Volcano团队针对这些挑战进行了各种探索和优化实践,并取得了优异的成果。

解决思路:
我们主要针对机器学习的特点,从调度方面进行了优化,提供了组调度、binpack、拓扑调度、GPU共享等多种调度策略,有效缩短了分布式训练的时间。同时我们增强了分布式训练作业的生命周期管理,让分布式训练更简单、更高效。

成果:
优化后实际分布式训练性能提升30%以上

目标收益

1. 机器学习、深度学习平台优化经验
2. 基于Kubernetes的机器学习平台调度系统设计经验
3. 开源社区运作、参与经验

培训对象

课程内容

案例方向


数据商业化/大数据架构/NLP/人工智能产品落地

案例背景


随着Kubernetes的成熟,越来越多的企业把Kubernetes作为AI、大数据、高性能计算的下一代基础设施。然而Kubernetes作为通用解决方案在AI、大数据等专业领域仍然和业务诉求存在一定的差距。主要挑战在调度能力无法满足计算需求、作业管理能力无法满足AI训练的复杂需求、资源管理能力缺少分时共享等等。Volcano团队针对这些挑战进行了各种探索和优化实践,并取得了优异的成果。

收益


1. 机器学习、深度学习平台优化经验
2. 基于Kubernetes的机器学习平台调度系统设计经验
3. 开源社区运作、参与经验

解决思路


我们主要针对机器学习的特点,从调度方面进行了优化,提供了组调度、binpack、拓扑调度、GPU共享等多种调度策略,有效缩短了分布式训练的时间。同时我们增强了分布式训练作业的生命周期管理,让分布式训练更简单、更高效。

结果


优化后实际分布式训练性能提升30%以上

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

提交需求