课程费用

5800.00 /人

课程时长

2

成为教练

课程简介

1. 使用“用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、真实的用户离网流失分析数据集、真实用户的换机数据模型进行项目制内容讲解,阐述从经典协同过滤、略复杂的隐特征推荐算法、深度学习方案的推荐算法、大厂使用的“非经典”推荐算法(如word2vec模型在数据中的使用等)。
2.实践和理论相结合。学习期间将按照真实的“项目开发”模式进行。

目标收益

1.推荐系统算法基础和机器学习模型
2.数据集分析和推荐系统的整体结构
3.特征工程
4.基于协同过滤的商品推荐
5.基于协同过滤和隐特征的商品推荐
6.完成推荐系统的整体设计和算法验证

培训对象

有Python编程经验 至少1年软件工程研发经验 初步掌握机器学习算法的理论基础

课程大纲

第1节:推荐系统算法基础和机器学习模型 1. python解释器与概况
2. 数据挖掘和机器学习包的应用
3. 爬虫的编写
4. json与数据交换
5. 线性回归
6. Logistic回归
7. 随机森林
8. 层次聚类、空间密度聚类
9. 协同过滤
10. 卷积神经网络
第2节:数据集分析和推荐系统的整体结构 1. “用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用户离网流失分析数据集、用户的换机模型等数据集的各自分析。
2. 完成数据表读写和检索
3. 完成数据表关联分析
4. 完成两个进阶矩阵“用户列表”和“商品列表”,为协同过滤做准备
第3节:特征工程 1. 数据清洗:异常值、空值的处理
2. 完成数据分析和特征选择
3. 完成用户相似度、商品相似度的计算
思考:使用不同相似度会产生何种影响(非常重要)
第4节:基于协同过滤的商品推荐 1. 搜索是推荐的系统基础
2. 邻接表的使用
3. 基于搜索系统,完成快速检索
4. user-based/item-based 协同过滤算法的使用
5. 分类标签和作用和如何定义标签
6. 商品评论中的分值计算
7. 邻接表的逆向使用:使用商品对用户打分
8. 建立用户兴趣模型
9. 构建少量用户访问记录
10. 构建用户“关键词”模型,思考和TopN模型的区别
第5节:基于协同过滤和隐特征的商品推荐 1.基于标准测试集,构建用户访问记录
2.基于标准测试集,构建商品被访问记录
3. 完成实时和离线的user-based 推荐
4. 完成实时和离线的item-based 推荐
5. 隐特征推荐的含义
6. LFM模型的算法原理
7. SVD模型和LFM的比较
8. LFM、SVD模型用于隐特征的推荐
  
第6节:完成推荐系统的整体设计和算法验证 1. 完成特征选择文档
2. 完成特征的构建
3. 完成基于LR的点击预估模型训练
4. 完成基于LR的线上推荐服务
5. 完成多种推荐算法的整合
6. 完成项目总结
思考:
 
1. 如何获得更多的特征,如冷启动阶段。
2.是否能使用深度学习模型,如果可以,如何使用。
第1节:推荐系统算法基础和机器学习模型
1. python解释器与概况
2. 数据挖掘和机器学习包的应用
3. 爬虫的编写
4. json与数据交换
5. 线性回归
6. Logistic回归
7. 随机森林
8. 层次聚类、空间密度聚类
9. 协同过滤
10. 卷积神经网络
第2节:数据集分析和推荐系统的整体结构
1. “用户-电影”数据集、Large Movie Review Dataset、MovieLens Dataset、Netflix、TMDB、用户离网流失分析数据集、用户的换机模型等数据集的各自分析。
2. 完成数据表读写和检索
3. 完成数据表关联分析
4. 完成两个进阶矩阵“用户列表”和“商品列表”,为协同过滤做准备
第3节:特征工程
1. 数据清洗:异常值、空值的处理
2. 完成数据分析和特征选择
3. 完成用户相似度、商品相似度的计算
思考:使用不同相似度会产生何种影响(非常重要)
第4节:基于协同过滤的商品推荐
1. 搜索是推荐的系统基础
2. 邻接表的使用
3. 基于搜索系统,完成快速检索
4. user-based/item-based 协同过滤算法的使用
5. 分类标签和作用和如何定义标签
6. 商品评论中的分值计算
7. 邻接表的逆向使用:使用商品对用户打分
8. 建立用户兴趣模型
9. 构建少量用户访问记录
10. 构建用户“关键词”模型,思考和TopN模型的区别
第5节:基于协同过滤和隐特征的商品推荐
1.基于标准测试集,构建用户访问记录
2.基于标准测试集,构建商品被访问记录
3. 完成实时和离线的user-based 推荐
4. 完成实时和离线的item-based 推荐
5. 隐特征推荐的含义
6. LFM模型的算法原理
7. SVD模型和LFM的比较
8. LFM、SVD模型用于隐特征的推荐
  
第6节:完成推荐系统的整体设计和算法验证
1. 完成特征选择文档
2. 完成特征的构建
3. 完成基于LR的点击预估模型训练
4. 完成基于LR的线上推荐服务
5. 完成多种推荐算法的整合
6. 完成项目总结
思考:
 
1. 如何获得更多的特征,如冷启动阶段。
2.是否能使用深度学习模型,如果可以,如何使用。
提交需求