搜狗分身-面向自然交互的多模态人机交互解决方案-精品课程-软件研发管理培训、咨询服务-MSUP

课程简介

案例背景:
未来人机交互的方式已成为行业研究探索的热点，毫无疑问，自然交互是最重要的目标，而多模态人机交互则是实现自然交互的非常关键的技术，如何实现多模态的识别、理解、表达都遇到很大的挑战，本次报告希望能够分享搜狗在多模态人机交互上的思考，特别在如何实现多模态融合识别以及表达上的工作。

解决思路:
我们的研究重点主要放在如下三项技术的研究，目前行业都属于探索阶段，搜狗率先实现了实用化落地，在落地过程中结合产品需求设计算法和工程，非常关键：
1. 多模态识别技术
2. 多模态表达技术
3. 面向自然交互的数字人技术

成果：
我们实现了语音+唇语的多模态识别技术，在高噪情况下识别错误率可以下降40%以上，同时我们在数字人技术上实现了重大突破，发布了搜狗分身，真正实现了数字人的生产和驱动，最终能够实现自然交互式的人与数字人的交流对话。

目标收益

1. 了解人机交互目前的趋势
2. 了解语音交互过程各个环节的研发进展及应用情况
3. 了解以数字人为基础的多模态交互研发进展及应用情况

培训对象

课程内容

案例方向

智能语音/NLP/推荐/广告系统实战/计算机视觉

案例背景

未来人机交互的方式已成为行业研究探索的热点，毫无疑问，自然交互是最重要的目标，而多模态人机交互则是实现自然交互的非常关键的技术，如何实现多模态的识别、理解、表达都遇到很大的挑战，本次报告希望能够分享搜狗在多模态人机交互上的思考，特别在如何实现多模态融合识别以及表达上的工作。

收益

1. 了解人机交互目前的趋势
2. 了解语音交互过程各个环节的研发进展及应用情况
3. 了解以数字人为基础的多模态交互研发进展及应用情况

解决思路

我们的研究重点主要放在如下三项技术的研究，目前行业都属于探索阶段，搜狗率先实现了实用化落地，在落地过程中结合产品需求设计算法和工程，非常关键：
1. 多模态识别技术
2. 多模态表达技术
3. 面向自然交互的数字人技术

结果

我们实现了语音+唇语的多模态识别技术，在高噪情况下识别错误率可以下降40%以上，同时我们在数字人技术上实现了重大突破，发布了搜狗分身，真正实现了数字人的生产和驱动，最终能够实现自然交互式的人与数字人的交流对话。

搜狗分身-面向自然交互的多模态人机交互解决方案

理想汽车AI首席科学家智能驾舱AI负责人

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

课程简介

目标收益

培训对象

课程内容

课程评论

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

近期公开课推荐

近期公开课推荐

LLM在软件测试领域的应用实践与大厂实战案例解读（公开课）

搜狗分身-面向自然交互的多模态人机交互解决方案

理想汽车AI首席科学家 智能驾舱AI负责人

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

课程简介

目标收益

培训对象

课程内容

课程评论

课程费用

6800.00 /人

课程时长

50分钟以下及更短时间

近期公开课推荐

近期公开课推荐

LLM在软件测试领域的应用实践与大厂实战案例解读（公开课）

理想汽车AI首席科学家智能驾舱AI负责人