深度学习前沿 - 谷歌变形金刚架构及其应用-精品课程-软件研发管理培训、咨询服务-MSUP

B. Ma

前百度高级算法工程师

中国原子能科学研究院理论物理硕士、中国科学院软件研究所博士。曾领导重构百度搜索引擎核心模块，实现了九年历史四十万行遗留代码的优化；作为量化派技术总监，带领技术部开发和重构了基于金融大数据的借贷交易平台和信审平台；应用机器学习技术在丁丁租房多项在线服务（推荐信审反中介派单策略定价模型等）；在Baidu AI 度秘团队负责NLU策略和模型

课程简介

深度学习前沿 - 谷歌变形金刚架构及其应用

目标收益

培训对象

课程大纲

1. 注意力机制 Attention	- Seq-to-Seq 架构的核心 - 简单的 machine translation with attention: NMT - Neural Machine Translation - R-NET: MSRA 的 attention-based 阅读理解模型 - Neural Turning Machine - Attention 的扩展应用：原理、实现
2. Attention is All You Need - 注意力模型的“终极版”	- 架构、原理和实现 - 和“传统” Attention 模型的比较
3. 变形金刚 Transformer	- 例子：句子分类 - 模型架构 - 与卷积网络的异同 - Embedding 的新时代 - 变形金刚：超越 LSTM
4. ELMo 和 BERT 模型	- ELMo：对上下文的强调 - BERT：从解码器到编码器

1. 注意力机制 Attention

- Seq-to-Seq 架构的核心
- 简单的 machine translation with attention: NMT - Neural Machine Translation
- R-NET: MSRA 的 attention-based 阅读理解模型
- Neural Turning Machine - Attention 的扩展应用：原理、实现

2. Attention is All You Need - 注意力模型的“终极版”

- 架构、原理和实现
- 和“传统” Attention 模型的比较

3. 变形金刚 Transformer

- 例子：句子分类
- 模型架构
- 与卷积网络的异同
- Embedding 的新时代
- 变形金刚：超越 LSTM

4. ELMo 和 BERT 模型

- ELMo：对上下文的强调
- BERT：从解码器到编码器

深度学习前沿 - 谷歌变形金刚架构及其应用

B. Ma

前百度高级算法工程师

课程费用

6800.00 /人

课程时长

1天

课程简介

目标收益

培训对象

课程大纲

课程评论

课程费用

6800.00 /人

课程时长

1天

近期公开课推荐

近期公开课推荐

深度学习和大模型技术全方位解析

深度学习前沿 - 谷歌变形金刚架构及其应用

B. Ma

前百度 高级算法工程师

课程费用

6800.00 /人

课程时长

1天

课程简介

目标收益

培训对象

课程大纲

课程评论

课程费用

6800.00 /人

课程时长

1天

近期公开课推荐

近期公开课推荐

深度学习和大模型技术全方位解析

前百度高级算法工程师