课程费用

5800.00 /人

课程时长

2

成为教练

课程简介

课程讲授人是从事深度学习项目管理的人员,带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富。

目标收益

1,整体把握机器学习、深度学习、数据挖掘的发展方向
2,了解机器学习、深度学习的技术框架
3,理解机器学习和深度学习的思维方式和关键技术
4,独立完成深度学习和机器学习在简单实际场景的落地应用

培训对象

课程内容

第一篇:机器学习与深度学习
第一节:Python数据分析
Numpy/Scipy/Pandas/Matplotlib/Seaborn库
Numpy基础属性与数组创建
Numpy索引
Numpy数学运算与常用分布
Pandas数据处理与分析
Pandas文件读写和个性化控制
Pandas的concat与merge
Matplotlib 基本图结构介绍
基于Matplotlib绘制散点图、柱状图、等高线图、3D图等
多图合并与图片文件存取
Seaborn/PyEcharts等包的使用
scikit-learn的介绍和典型使用
逻辑回归、决策树、随机森林、SVM
XGBoost、LightGBM
多元高斯分布
典型图像处理
多种数学曲线
多项式拟合
代码和案例实践:
快速傅里叶变换FFT与信号处理
Soble/Prewitt/Laplacian算子与卷积网络
卷积与(指数)移动平均线
股票数据分析
缺失数据的处理和预测
环境数据异常检测和分析
快速傅里叶变换FFT
图像处理与奇异值分解SVD
第二节:机器学习核心原理和损失函数:回归分析
线性回归
Logistic/Softmax回归
广义线性回归
L1/L2正则化
Ridge与LASSO
Elastic Net
梯度下降算法:BGD与SGD
特征选择与过拟合
Softmax回归的概念源头
最大熵模型
K-L散度
代码和案例实践:
股票数据的特征提取和应用
泰坦尼克号乘客缺失数据处理和存活率预测
环境检测数据异常分析和预测
模糊数据查询和数据校正方法
PCA与鸢尾花数据分类
二手车数据特征选择与算法模型比较
广告投入与销售额回归分析
鸢尾花数据集的分类
TensorFlow实现线性回归
TensorFlow实现Logistic回归
第三节:决策树和随机森林
熵、联合熵、条件熵、KL散度、互信息
最大似然估计与最大熵模型
ID3、C4.5、CART详解
决策树的正则化
预剪枝和后剪枝
Bagging
随机森林
不平衡数据集的处理
利用随机森林做特征选择
使用随机森林计算样本相似度
异常值检测
代码和案例实践:
随机森林与特征选择
决策树应用于回归
多标记的决策树回归
决策树和随机森林的可视化
葡萄酒数据集的决策树/随机森林分类
泰坦尼克乘客存活率估计
第四节:聚类分析
各种相似度度量及其相互关系
Jaccard相似度和准确率、召回率
Pearson相关系数与余弦相似度
K-means与K-Medoids及变种
层次聚类:自顶向下,自底向上
AP算法(Sci07)/LPA算法及其应用
密度聚类DBSCAN/DensityPeak(Sci14)
谱聚类SC
聚类评价和结果指标
代码和案例实践:
1.K-Means++算法原理和实现
2.向量量化VQ及图像近似
3.并查集的实践应用
4.密度聚类的异常值检测
5.谱聚类用于图片分割
第五节:XGBoost与LightGBM模型详解
定义树的复杂度
boosting tree的提升思路
残差的选择
XGBoost损失函数的提成
Loss的精确一阶导数和二阶导数
近似加权分位法
稀疏自适应分割策略
XGBoost的过拟合与正则化目标函数
算法成功之处和存在的问题
boosting框架总览
重新认识样本的梯度
GOSS思想在LightGBM中的应用
贪心和启发式特征搜索
EFB候选特征的选择
Histogram算法与Pre-sorted算法对数据结构的影响
样本采样与权重
再谈引入稀疏数据的原因
单边采样带来的训练样本减少
代码和案例实践:
1.收入分类模型的提升应用
2.XGBoost库与sklearn库的使用
3.提升模型在用户感知评分预测的应用
4.XGBoost用于真实信号数据中的分类建模和调参
5.钻井工况数据在LightGBM中的实践
6. LightGBM与XGBoost的性能比较
7.基站小区节能预测建模
8.哪些场景不适合LightGBM
第六节:深度学习环境配置与卷积神经网络
GPU下的TensorFlow、PyTorch环境安装
Pytorch框架介绍和环境搭建
Pytorch张量、卷积等基础知识
神经网络结构,滤波器,卷积
池化,激活函数,反向传播
目标分类与识别、目标检测与追踪
AlexNet、VGGNet、GoogleLeNet
Inception-V3/V4
MLP多层感知机模型搭建与代码实现
Pytorch分类模型ResNet、DenseNet的实现
Pytorch对回归建模损失函数的修正
代码和案例实践:
数字图片分类
卷积核与特征提取
以图搜图
人证合一
卷积神经网络调参经验分享
第七节:Pytorch时间序列分析
隐马尔科夫模型
HMM与CRF
ARIMA、时间序列分析
一维卷积、指数平均和滑动平均、
Prophet模型对时间序列分析的影像
MaxPooling做光滑的trick
Bi-LSTM双向循环网络
Pytorch函数式API与回调函数
代码和案例实践:
时间序列算法:自回归、移动平均和整合模型
股票走势可视化
突变点分析
股票预测模型建立
模型训练
预测与评估
第八节:深度学习文本建模
语言模型Bi-Gram/Tri-Gram/N-Gram
分词算法的原理及类似应用
词性标注
语义关系抽取
词向量
文本分类:基于CNN和基于LSTM的方法比较
机器翻译:Seq2Seq的典型应用
Transformer、BERT等模型原理
文本摘要与信息抽取
阅读理解
问答系统
情感分析
代码和案例实践:
知识图谱:命名实体识别的实践
知识图谱:实体关系的判定与分类
HMM分词及CRF的异同
文本摘要的生成
智能对话系统和SeqSeq模型
阅读理解的实现与Attention
机器翻译
使用LSTM生成文本
第九节:生成对抗网络GAN和扩散模型DM
GAN-VAE-流模型-扩散模型的技术发展和变化
CLIP和扩散模型的结合:基于CLIP模型的多模态引导图像生成:图文引导
GLIDE:文本引导
Diffusion-CLIP模型
扩散和去噪(Diffusion&Denoise)
训练和采样(Training&Sampling)
离散步骤的马尔可夫链
分子热动力学的扩散过程
离散加噪
DDPM-最经典的扩散模型
DDIM:加速采样、可控扩散
IVLR:迭代去燥的图像编辑,低通滤波上采样
RePaint: 被掩码的区域进行扩散生成
CLIP和扩散模型的结合:基于CLIP模型的多模态引导图像生成:图文引导
GLIDE:文本引导
DALL·E 2:diffusion model和CLIP结合在一起
隐式分类器引导的图像生成
Blended Diffusioni模型
Diffusion-CLIP模型
DiffEdit模型
分别实现图像引导、文字引导、图文引导下的图片生成
Diffusion LM
AIGC的可能应用领域和行业影响
代码和案例实践:
低质量噪声图像修复
精确复原原图
图像去除遮挡、图像补全
图像生成(人物恢复青春、人物变瘦)
图像引导、文本引导、图像+文本引导

第二篇 实际项目实战(可增补其他感兴趣的项目)
第一节:用户满意度多分类预测
使用运营商用户网络感知评分真实数据,结合O域信令数据及B域用户数据,采样时间为近半年网络评分用户数据。 参赛选手需要根据训练数据集(train.csv)训练模型,并预测测试集中用户的网络感知打分(test.csv)。
涉及知识点和代码框架中注意问题:
1、字符串数值化
2、空值处理
3、异常值处理
4、特征分箱
5、One-hot编码
4、选择回归与分类模型
5、提高模型MAE/F1-score的通用方法
第二节:基站节能策略合理性预测
基于无线基站节能场景,提供5天不同场景下若干小区节能策略数据共1万余行,并给出了相应的评判标签:节能策略合理或不合理,从而训练出合适的数据推理模型来预测小区节能策略的合理性。
涉及知识点和代码框架中注意问题:
1、多列关键字的数据分组
2、宽表的生成、多表合并
3、机器学习数据标准表的整理:A+C/A+C模式
4、机器学习模型选择
5、机器学习模型调参
第三节:多元网络业务趋势预测
基于某网络业务场景,针对若干个业务ID,提供多个指标小时粒度的历史数据,对其中某一指标进行趋势预测,得到未来24小时的小时粒度数据。
涉及知识点和代码框架中注意问题:
1、单列关键字的数据分组与表格化输出
2、特征筛选
3、同比-环比问题
4、经典时间序列模型的建模和调参
5、深度学习模型的TSA尝试
6、时间序列建模自回归方案
第四节:通用文本情感二分类预测
本赛题进行通用文本的情感分类,选取了外卖、酒店、旅游、美食评论、电影评论等多个生活中常用的领域第三方APP下的评论数据作为本次赛题的数据集。本次赛题的输入是一段文字,输出是“积极”和“消极”两种情感类型的标签,其中“积极”用1表示,“消极”用0表示。
1、不同文本格式的读写
2、文本合并
3、数据增强
4、词向量、字向量
5、机器学习模型下的文本分类
6、深度学习模型搭建
7、GPU的TensorFlow、pyTorch部署与使用
8、深度模型的训练和调参

提交需求