人工智能机器学习及在金融行业应用课件.ppt
《人工智能机器学习及在金融行业应用课件.ppt》由会员分享,可在线阅读,更多相关《人工智能机器学习及在金融行业应用课件.ppt(52页珍藏版)》请在三一办公上搜索。
1、人工智能机器学习及在金融行业应用,人工智能机器学习及在金融行业应用,内容,?,人工智能,?,机器学习,AI,分支,?,定义、流派,?,任务,?,常见范式,?,算法介绍,?,在金融中的(潜在)应用,?,总结:金融应用场景,内容 ?人工智能 ?机器学习AI分支 ?定义、流派 ?任,人工智能(,AI,),?,1956,年,达特茅斯会议,(John McCarthy,1927,2011),约翰,.,麦卡锡,AI,五十年留念(,19562006),什么是,AI,?,(Marvin Minsky,1927,2016),马文,.,明斯基,-,研究如何让计算机完成那些只有依靠人类智力才能完成的任务,Mavin
2、,Minsky,-,实现人类智能的功能,途径并不一定与人类智力相同,John McCarthy,-,研究提升机器解决复杂任务能力的领域,人工智能(AI) ?1956年,达特茅斯会议 (John,AI,科学的分支,计算机,视觉,语音,识别,基于规则,的系统,机器学习,自然语言,处理,机器人学,AI科学的分支 计算机视觉 语音识别 基于规则的系统 机器学,机器学习,无处不在,机器学习无处不在,机器学习,?,何为机器学习?,机器通过算法自动地从数据中学习知识,?,两大派别,?,AI,的一个分支,(计算机科学家),关注问题,不在乎手段(统计、代数、逻辑、几何),?,应用统计学的分支,(统计学家),关注
3、算法、不在乎实用,?,经典统计学(频率主义),机器学习,?,足够测量,无需构建模型,?,适合小型问题(少量参数),?,可解释,统计学,AI,分支,?,但复杂问题数据稀疏?举例,分支,机器学习 ?何为机器学习? 机器通过算法自动地从,机器学习,vs.,经典统计学,欠拟合(偏差大),过拟合(方差大),参数优化,目前,金融行业模型,(特别是,风险控制,),?,基于计量经济学理论,?,统计学,为主要分析方法,机器学习 vs. 经典统计学 欠拟合(偏差大) 过拟合(,机器学习(,AI,分支),?,“,Machine Learning is the study of computer algorithms
4、 that,improve automatically through,experience,.,”,Tom Mitchell,,,1997,?,从示例(,instance,)中学习,?,何为示例?标签?,?,特征工程(重要),机器学习(AI分支) ?“Machine Learning,金融领域的特征举例,?,多因子选股模型中常用的组合特征及逻辑,金融领域的特征举例 ?多因子选股模型中常用的组合特征及逻辑,股票因子池,?,特征建构,?,特征抽取,?,特征选择,股票因子池 ?特征建构 ?特征抽取 ?特征选择,机器学习任务,?,分类、回归问题(有标签),预测性,Data Supervised Se
5、mi-supervised Active Learning,?,聚类、相关性问题(无标签),描述性,Unsupervised,机器学习任务 ? 分类、回归问题(有标签)预测性,各种机器学习范式,?,监督学习,?,无监督学习,?,半监督学习,?,主动学习,?,迁移学习,?,多任务学习,?,多示例学习,?,多标记学习,?,强化学习,?,深度学习,各种机器学习范式 ?监督学习 ?无监督学习 ?半监督学习 ?,监督学习(,Supervised Learning,),?,两大任务,?,回归,(,regression,),?,分类,(,classification,),观察数据分为不同的类别,?,回归,(
6、,区别于统计学的回归),解决过拟合,引入正则项,变量相关性、非线性,惩罚回归模型(,Lasso,回归、岭回归等)、卡曼滤波,?,分类,准确率高、预测意义大,Logistic,回归、,SVM,、决策、随机森林、神经网络、,boosting,监督学习(Supervised Learning) ?两大任,分类算法,Logistic,(对数几率)回归,?,广义线性回归(线性变换,+,非线性函数),?,sigmoid,函数,?,应用:,垃圾邮件分类、疾病判断,分类算法Logistic(对数几率)回归 ?广义线性回归,Logistic,回归在金融中的应用,?,信贷风险管理,?,资产价格变化方向的预测,Lo
7、gistic回归在金融中的应用 ?信贷风险管理 ?资产价,分类算法,-SVM(Support Vector Machine),?,思想:,找到最佳超平面使得正负样本间隔最大,?,采用核函数解决非线性问题(高维映射、低维内积),?,适用于:小样本、非线性、高维度问题,?,缺点:数据敏感、非线性问题需选核函数、复杂度高,分类算法-SVM(Support Vector Machin,SVM,在金融中的应用,?,举例,:,资产价格变化方向的预测,线性组合,SVM,分类,?,举例:多因子选股,(训练:因子暴露度和收益率),1.,线性核收益分化明显(高斯核、多项式核、线性核),2.,与传统多因子模型比无较
8、大优势,SVM在金融中的应用 ?举例:资产价格变化方向的预测,算法介绍,决策树,(Decision Tree),冷血,表皮,体温,恒温,非爬行类,动物,鳞片,爬行类,动物,非爬行类,动物,?,非企业投资决策技术,?,用于,:分类和预测,?,方法:,寻找最优变量和分裂阈值(,Gini,系数、熵),最小化,损失函数,?,特点,:逻辑简单、鲁棒性差、可集合其他模型,?,算法介绍决策树(Decision Tree),决策树在金融中的应用,?,举例:决策树选股,因子暴露度与个股收益率存在非线性关系,选用:动量(,Mom,)、波动率(,Vol,),市盈率(,PE,)三个因子,决策树在金融中的应用 ?举例:
9、决策树选股 因子暴,算法介绍,贝叶斯,?,理论:主观判断,新信息修正信念,P(A/B)=P(B/A)*P(A)/P(B),?,用于:分类,P(C=1|X1,X2,X3) P(C=2|X1,X2,X3),则判定类别为,1,;否则为,2,找出最大的,P(X|C)P(C),P(X1,X2,X3|C=i),= P(X1|C=i)*P(X2|C=i)*P(X3|C=i),?,贝叶斯网络,(贝叶斯公式,+,图论),?,应用:,治病机制、投资策略、过滤垃圾邮件等,?,优势:,利用经验做合理判断和修正,适合金融市场,算法介绍贝叶斯 ?理论:主观判断,新信息修正信念,贝叶斯定理在金融中的应用,?,举例:风险管理
10、,(企业违约概率,,CDS,市场价),市场信息,+,投资者主观判断,举例:反洗钱,(西交大张成虎等),贝叶斯定理在金融中的应用 ?举例:风险管理(企业违约概率,C,无监督学习(,Unsupervised Learning,),?,特点:数据无标签,学习分布特征,?,两类:,?,聚类(,K,-means,、层次聚类、谱聚类),分成集群(簇),使集群内部有较高的相似性,,而集群之间相似度较低,?,降维(因子分析、,PCA,、,ICA,),在众多变量或指标中提取具有代表性的特征(因,子或因子组合),例如:在多资产组合中,识别出如动量、价值、波动性、,流动性等主要驱动因素。,无监督学习(Unsuper
11、vised Learning) ?,聚类算法,K-means,?,步骤:,1,、选择,K,个初始中心点,2,、计算,cost,,组成簇,3,、计算簇内所有点的均值作为新的聚类中心重复上面步骤,直至聚类稳定。,?,优点:,逻辑清晰、高速,?,局限:,需给定,K,和,初始中心点,聚类算法K-means ?步骤: 1、选择K个初始中心点,聚类在金融中的应用,?,举例:股票分析(流通市值、波动率),聚类在金融中的应用 ?举例:股票分析(流通市值、波动率),聚类在金融中的应用,?,股票、基金筛选、资产配置,聚类,例如:资产分层聚类,投资组合风险分散化,?,选股准备(提取主要因子),降维,?,常用的,Ba
12、rra,多因子模型,聚类在金融中的应用 ?股票、基金筛选、资产配置聚类,半监督学习(,Semi-Supervised Learning,),?,问题:,少量标注样本,大量未标注样本,?,方法:,?,半监督,SVM,?,标签传播,?,PU,学习等,?,应用场景,?,产品推荐,半监督学习(Semi-Supervised Learning,主动学习(,Active Learning,),?,针对问题,:标注样本少,?,思想:,主动向,oracle,获得标注信息,?,获得哪些样本的标注?,需设计查询函数,Q,?,什么是有用的样本?,?,不确定,(uncertainty),?,差异性,(diversit
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 机器 学习 金融 行业 应用 课件
链接地址:https://www.31ppt.com/p-1946412.html