架构师
互联网
大数据
机器学习
数据挖掘
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

金融大数据特征工程

常国珍

前思特沃克(Thoughtworks)软件技术有限公司 首席科学家

ThoughtWorks首席金融数据科学家,北京大学管理学博士,中国大数据产业生态联盟专家委员会委员,腾讯云最有价值专家(TVP),建设银行数据资产管理资深专家。著作《Python数据科学:技术详解与商业实践》、《用商业案例学R语言数据挖掘》、《胸有成竹:数据分析的SASEG进阶》等多本著作。拥有15年金融、电信和互联网行业经验。在加入ThoughtWorks之前,曾在毕马威咨询大数据部担任总监、在中银消费金融数据部担任高级经理、在百度大数据部担任算法工程师。现专注于金融行业的数据战略、数据应用、数据治理和数字化人才培养,同时提供数智化客户运营和风险管控的解决方案。

ThoughtWorks首席金融数据科学家,北京大学管理学博士,中国大数据产业生态联盟专家委员会委员,腾讯云最有价值专家(TVP),建设银行数据资产管理资深专家。著作《Python数据科学:技术详解与商业实践》、《用商业案例学R语言数据挖掘》、《胸有成竹:数据分析的SASEG进阶》等多本著作。拥有15年金融、电信和互联网行业经验。在加入ThoughtWorks之前,曾在毕马威咨询大数据部担任总监、在中银消费金融数据部担任高级经理、在百度大数据部担任算法工程师。现专注于金融行业的数据战略、数据应用、数据治理和数字化人才培养,同时提供数智化客户运营和风险管控的解决方案。

课程费用

6800.00 /人

课程时长

2

成为教练

课程简介

金融大数据的积累使得深度客户洞察和风险识别成为可能。根据笔者的实践,发现金融数据挖掘的最终模型由业务人员高度参与时的投入产出比是更高的,但是由于业务人员的技术能力有限,难以从浩瀚的数据海洋中提取高价值变量,因此往往处于“理想很丰满、现实很骨干”的状态。在大量数据面前缺抱怨无数可用。
整个数据挖掘价值链中,分为五个阶段,分别是构建数据集市、特征生成、建立模型、模型上线、执行策略与实施。其中特征生成对分析技术的要求最高,既需要对业务中模型运用的场景有深入的把握,又需要精通各类机器学习和深度学习算法,可以从交易时序、复杂网络、半结构化数据中提取用于建模用的结构化宽表。
本课程使用真实场景下的金融落地案例,从业务洞察、算法能力、系统架构这三个维度上搭建起金融特征工程的框架体系。

目标收益

1、为银行的业务人员开拓业务洞察视野和提供标准化的建模路线图。
2、为算法工程师提供算法与业务的结合点。
3、为数据工程师提供系统架构设计思路。
4、为有志于从事金融大数据的人员提供定位指导和学习路线图。

培训对象

银行的业务人员
算法工程师、数据科学家
市场、渠道高级经理及以上级别

课程大纲

一、金融大数据和人工智能的行业应用与发展 1.人工智能的行业图谱和行业发展割析
2.人工智能结合大数据的金融行业应用案例
3.人工智能在金融领域的应用
二、金融大数据分析的价值链 1、构建数据集市
2、特征生成
3、建立模型
4、模型上线
5、执行策略与实施
三、金融数据科学的三大分析范式和八大场景 1、金融行业中,决策、判别、优化的三大分析范式
2、八大分析场景和特征工程的业务洞察
3、标签体系框架
四、特征工程的算法框架 1、时序及空间特征提取及传统机器学习算法
2、文本特征提取及深度学习算法
3、复杂网络特征提取及图算法
五、金融大数据处理能力 1、传统数据库产品的局限性
2、Spark在特征工程上的运用价值
3、分布式深度学习在特征工程上的运用价值
一、金融大数据和人工智能的行业应用与发展
1.人工智能的行业图谱和行业发展割析
2.人工智能结合大数据的金融行业应用案例
3.人工智能在金融领域的应用
二、金融大数据分析的价值链
1、构建数据集市
2、特征生成
3、建立模型
4、模型上线
5、执行策略与实施
三、金融数据科学的三大分析范式和八大场景
1、金融行业中,决策、判别、优化的三大分析范式
2、八大分析场景和特征工程的业务洞察
3、标签体系框架
四、特征工程的算法框架
1、时序及空间特征提取及传统机器学习算法
2、文本特征提取及深度学习算法
3、复杂网络特征提取及图算法
五、金融大数据处理能力
1、传统数据库产品的局限性
2、Spark在特征工程上的运用价值
3、分布式深度学习在特征工程上的运用价值
提交需求