大模型和智能体底层核心技术及实战-精品课程-软件研发管理培训、咨询服务-MSUP

课程简介

学员要求：本课程面向有一定经验的数据分析师、AI工程师或业务建模专家。因为涉及NLP、CV、大模型三个方面的原理和代码，建议有一定的IT基础，具备基础的Python知识。

目标收益

培训对象

课程大纲

第一节：大模型的提示工程与智能软件组合应用	1.文件分类与检索优化 2.利用 DeepSeek 的语义分析能力，对文件进行智能分类 3.构建高效的文件检索系统，通过关键词和语义搜索快速定位文件 4.文件内容提取与分析 5.从各类文档中提取关键信息，如合同中的条款、报告中的数据等 6.运用 DeepSeek 进行文本数据分析，生成可视化报告 7.不同岗位文件处理重点应用 8.自动化报告生成：整合多平台数据生成日报/周报 9.DeepSeek在Excel中的应用 10.DeepSeek在数据分析实战演练 11.DeepSeek在Excel问题解决、思路构建等方面的应用方法 12.DeepSeek生成Excel函数的用法 13.使用DeepSeek大模型辅助数据分析 14.利用 DeepSeek 生成 PPT 大纲和PPT精修 15.与DeepSeek对话，获取讲故事和写作技巧 16.根据大纲，使用 DeepSeek 获取相关图片、案例等素材 17.AI做海报、banner、详情图、做场景广告图 18.视频素材智能检索：通过语义标签快速匹配历史素材库（如节日营销内容复用）。 19.视频质量优化：自动检测画质、音效问题并修复（如直播回放优化）。 20.企业服务视频智能化
第二节：本地大模型私有化部署实操	1 Deepseek-R1蒸馏版的部署实操 1.模型获取： o通过HuggingFace官方仓库申请权限 o下载deepseek-r1-7B、8B、32B、70B的safetensors格式权重 2.推理服务启动 o关键参数trust_remote_code、max_model_len等的讲解 o解释器多种启动服务方式对比 3.服务验证 o代码调用 o服务API的参数设置 2 Qwen-3(刚刚发布1个月)部署 1.量化加速 oFP8的特点 o对比Deepseek原论文中量化章节的解读 2.REST API调用： o深度学习系统部署的常用方式 o针对AI算法的部署框架
第三节：银行数据的大模型微调、数据准备、模型训练	1 Deepseek-R1领域数据微调 1.数据准备： o格式：JSONL文件，每条含instruction/input/output o数据源：财报、券商研报、金融问答对、意图识别数据 o关键处理：使用SentencePiece重组专业术语tokenization 2.QLoRA训练配置 o微调在大模型中的常用方法 o多种LoRA方式的对别 3.启动训练 o显存优化 oGPU并行 2 探讨适合微调的业务场景 o阐述项目中RAG模式和LoRA模式的选择 o探讨微调方案的优势，分析不适合微调的场景
第四节：知识库建设与自定义知识问答RAG（重点讲解，提供多场景实例）	1私有数据的文档生成系统全流程实操架构设计： 1.数据层：Wind API实时获取宏观指标 + PDF解析模块 2.推理层： oDeepseek-R1作为生成核心 oMistral-8x7B进行事实核查 3.评估层： oRouge-L评估内容一致性 oFinBERT检测财务数据矛盾以部署拓扑理清整体脉络常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出 2 基于知识库的问答系统实操关键技术点： 1.RAG增强： o使用LlamaIndex构建行业知识图谱 oFAISS向量库实现百万级文档秒级检索 2.记忆管理： o缓存最近轮次的对话摘要 o采用CoT（Chain-of-Thought）提示工程技术 3.风控拦截： o关键词过滤（如“保证收益”、“100%”等违规表述） o置信度阈值设定（softmax概率<0.7时触发人工接管）
第五节：vLLM部署与实操	vLLM的快速实操体验（1）从Demo到生产：先通过examples/中的脚本运行基础推理，再逐步添加分布式、量化等高级特性。（2）性能调优闭环：使用benchmark工具量化指标 → 修改配置/代码 → 再次压测 → 分析优化效果。（3）故障注入测试：主动模拟GPU故障、网络抖动等异常场景，验证系统的容错与恢复能力。核心架构与关键技术 PagedAttention 内存管理v 分页机制动态管理注意力机制的键值（KV）缓存、16K+上下文长度隔离式EngineCore，分离调度与模型执行，通过ZeroMQ实现多进程深度整合统一调度器，动态分配请求资源，分块预填充chunked-prefill、前缀缓存prefix caching 零开销前缀缓存，优化哈希算法与数据结构异步执行与流水线优化 tokenization、多模态预处理等任务与核心推理重叠执行
第六节：MCP协议的代码实战	协议架构与设计原理客户端-服务器模型：MCP Host、Client、Server的交互逻辑上下文感知与多步骤任务任务链式调用，通过多次工具调用完成复杂推理关键技术特性：介绍 JSON-RPC 2.0 安全机制：沙盒隔离、零信任架构、敏感数据本地化处理协议架构与协作机制任务状态管理：任务提交、处理中和完成/失败的全生命周期管理关键技术特性：安全设计、高并发支持、多Agent协同复杂任务分解代码实战：完成基于MCP的内置工具调用代码实战：MCP自定义工具的实现代码实战：生成二维码、基于本地知识的检索和互联网检索能力的结合
第七节：基于COZE开发Agent 智能体	零基础开发AI Agent 智能体为什么要学习AI Agent 初步认识Agent Agent的概念与发展 Agent是高层级的AI技术应用 Agent的特点与能力 Agent开发平台的演进基于字节扣子code平台开发Agent 开发Agent的流程与策略 Agent开发的功能模块详解——插件、工作流、图像流 Agent开发的功能模块详解——知识库、记忆与对话体验实战篇——5大场景、11个Agent案例
第八节：基于Dify平台Agent智能体开发	1. 平台核心能力解析架构特性：可视化编排 vs 代码深度定制能力矩阵知识库管理：支持PDF/CSV/Markdown多格式对话引擎：基于LLM的意图识别准确率复杂业务流：需通过API扩展高级功能拓展自定义插件开发多轮对话策略设计 Agent 测试与优化 2. 快速搭建基金查询Agent 创建应用、知识库配置、对话流程设计、调试技巧 3. Agent开发自定义插件开发实战开发收益率计算插件创建Python插件脚手架实现核心逻辑复杂对话策略设计多轮状态管理方案 4. Agent优化性能调优方案缓存策略：为高频查询添加Redis缓存层负载均衡：配置Nginx反向代理实现多实例分发敏感信息过滤：正则表达式拦截敏感信息

第一节：大模型的提示工程与智能软件组合应用

1.文件分类与检索优化
2.利用 DeepSeek 的语义分析能力，对文件进行智能分类
3.构建高效的文件检索系统，通过关键词和语义搜索快速定位文件
4.文件内容提取与分析
5.从各类文档中提取关键信息，如合同中的条款、报告中的数据等
6.运用 DeepSeek 进行文本数据分析，生成可视化报告
7.不同岗位文件处理重点应用
8.自动化报告生成：整合多平台数据生成日报/周报
9.DeepSeek在Excel中的应用
10.DeepSeek在数据分析实战演练
11.DeepSeek在Excel问题解决、思路构建等方面的应用方法
12.DeepSeek生成Excel函数的用法
13.使用DeepSeek大模型辅助数据分析
14.利用 DeepSeek 生成 PPT 大纲和PPT精修
15.与DeepSeek对话，获取讲故事和写作技巧
16.根据大纲，使用 DeepSeek 获取相关图片、案例等素材
17.AI做海报、banner、详情图、做场景广告图
18.视频素材智能检索：通过语义标签快速匹配历史素材库（如节日营销内容复用）。
19.视频质量优化：自动检测画质、音效问题并修复（如直播回放优化）。
20.企业服务视频智能化

第二节：本地大模型私有化部署实操

1 Deepseek-R1蒸馏版的部署实操
1.模型获取：
o通过HuggingFace官方仓库申请权限
o下载deepseek-r1-7B、8B、32B、70B的safetensors格式权重
2.推理服务启动
o关键参数trust_remote_code、max_model_len等的讲解
o解释器多种启动服务方式对比
3.服务验证
o代码调用
o服务API的参数设置
2 Qwen-3(刚刚发布1个月)部署
1.量化加速
oFP8的特点
o对比Deepseek原论文中量化章节的解读
2.REST API调用：
o深度学习系统部署的常用方式
o针对AI算法的部署框架

第三节：银行数据的大模型微调、数据准备、模型训练

1 Deepseek-R1领域数据微调
1.数据准备：
o格式：JSONL文件，每条含instruction/input/output
o数据源：财报、券商研报、金融问答对、意图识别数据
o关键处理：使用SentencePiece重组专业术语tokenization
2.QLoRA训练配置
o微调在大模型中的常用方法
o多种LoRA方式的对别
3.启动训练
o显存优化
oGPU并行
2 探讨适合微调的业务场景
o阐述项目中RAG模式和LoRA模式的选择
o探讨微调方案的优势，分析不适合微调的场景

第四节：知识库建设与自定义知识问答RAG（重点讲解，提供多场景实例）

1私有数据的文档生成系统全流程实操
架构设计：
1.数据层：Wind API实时获取宏观指标 + PDF解析模块
2.推理层：
oDeepseek-R1作为生成核心
oMistral-8x7B进行事实核查
3.评估层：
oRouge-L评估内容一致性
oFinBERT检测财务数据矛盾
以部署拓扑理清整体脉络
常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出
2 基于知识库的问答系统实操
关键技术点：
1.RAG增强：
o使用LlamaIndex构建行业知识图谱
oFAISS向量库实现百万级文档秒级检索
2.记忆管理：
o缓存最近轮次的对话摘要
o采用CoT（Chain-of-Thought）提示工程技术
3.风控拦截：
o关键词过滤（如“保证收益”、“100%”等违规表述）
o置信度阈值设定（softmax概率<0.7时触发人工接管）

第五节：vLLM部署与实操

vLLM的快速实操体验
（1）从Demo到生产：先通过examples/中的脚本运行基础推理，再逐步添加分布式、量化等高级特性。
（2）性能调优闭环：使用benchmark工具量化指标 → 修改配置/代码 → 再次压测 → 分析优化效果。
（3）故障注入测试：主动模拟GPU故障、网络抖动等异常场景，验证系统的容错与恢复能力。
核心架构与关键技术
PagedAttention 内存管理v
分页机制动态管理注意力机制的键值（KV）缓存、16K+上下文长度
隔离式EngineCore，分离调度与模型执行，通过ZeroMQ实现多进程深度整合
统一调度器，动态分配请求资源，分块预填充chunked-prefill、前缀缓存prefix caching
零开销前缀缓存，优化哈希算法与数据结构
异步执行与流水线优化
tokenization、多模态预处理等任务与核心推理重叠执行

第六节：MCP协议的代码实战

协议架构与设计原理
客户端-服务器模型：MCP Host、Client、Server的交互逻辑
上下文感知与多步骤任务
任务链式调用，通过多次工具调用完成复杂推理
关键技术特性：介绍 JSON-RPC 2.0
安全机制：沙盒隔离、零信任架构、敏感数据本地化处理
协议架构与协作机制
任务状态管理：任务提交、处理中和完成/失败的全生命周期管理
关键技术特性：安全设计、高并发支持、多Agent协同
复杂任务分解
代码实战：完成基于MCP的内置工具调用
代码实战：MCP自定义工具的实现
代码实战：生成二维码、基于本地知识的检索和互联网检索能力的结合

第七节：基于COZE开发Agent 智能体

零基础开发AI Agent 智能体
为什么要学习AI Agent
初步认识Agent
Agent的概念与发展
Agent是高层级的AI技术应用
Agent的特点与能力
Agent开发平台的演进
基于字节扣子code平台开发Agent
开发Agent的流程与策略
Agent开发的功能模块详解——插件、工作流、图像流
Agent开发的功能模块详解——知识库、记忆与对话体验
实战篇——5大场景、11个Agent案例

第八节：基于Dify平台Agent智能体开发

1. 平台核心能力解析
架构特性：可视化编排 vs 代码深度定制
能力矩阵
知识库管理：支持PDF/CSV/Markdown多格式
对话引擎：基于LLM的意图识别准确率
复杂业务流：需通过API扩展
高级功能拓展
自定义插件开发
多轮对话策略设计
Agent 测试与优化
2. 快速搭建基金查询Agent
创建应用、知识库配置、对话流程设计、调试技巧
3. Agent开发
自定义插件开发实战
开发收益率计算插件
创建Python插件脚手架
实现核心逻辑
复杂对话策略设计
多轮状态管理方案
4. Agent优化
性能调优方案
缓存策略：为高频查询添加Redis缓存层
负载均衡：配置Nginx反向代理实现多实例分发
敏感信息过滤：正则表达式拦截敏感信息

大模型和智能体底层核心技术及实战

邹老师

长春工业大学人工智能学院院长

课程费用

5800.00 /人

课程时长

2天

课程简介

目标收益

培训对象

课程大纲

课程评论

课程费用

5800.00 /人

课程时长

2天

近期公开课推荐

近期公开课推荐

LLM在软件测试领域的应用实践与大厂实战案例解读（公开课）

大模型和智能体底层核心技术及实战

邹老师

长春工业大学 人工智能学院院长

课程费用

5800.00 /人

课程时长

2天

课程简介

目标收益

培训对象

课程大纲

课程评论

课程费用

5800.00 /人

课程时长

2天

近期公开课推荐

近期公开课推荐

LLM在软件测试领域的应用实践与大厂实战案例解读（公开课）

长春工业大学人工智能学院院长