流形学习专题介绍ppt课件.ppt
《流形学习专题介绍ppt课件.ppt》由会员分享,可在线阅读,更多相关《流形学习专题介绍ppt课件.ppt(71页珍藏版)》请在三一办公上搜索。
1、1,流形学习专题介绍,王瑞平人脸识别课题组中国科学院计算技术研究所,2010/05/06 VMR Group Book Readinghttp:/,2,提纲,研究背景基本知识介绍经典方法概览总结讨论,3,提纲,研究背景基本知识介绍经典方法概览总结讨论,4,从降维问题说起,降维的动机原始观察空间中的样本具有极大的信息冗余样本的高维数引发分类器设计的“维数灾难”数据可视化、特征提取、分类与聚类等任务需求,5,从降维问题说起,降维的动机,解决办法:选取尽可能多的, 可能有用的特征, 然后根据需要进行特征/维数约简.,6,从降维问题说起,降维的动机,7,降维方法概述,线性降维通过特征的线性组合来降维本
2、质上是把数据投影到低维线性子空间线性方法相对比较简单且容易计算代表方法主成分分析(PCA)线性判别分析(LDA)多维尺度变换(MDS),8,线性降维方法,主成分分析(PCA) Jolliffe, 1986降维目的:寻找能够保持采样数据方差的最佳投影子空间求解方法:对样本的散度矩阵进行特征值分解, 所求子空间为经过样本均值, 以最大特征值所对应的特征向量为方向的子空间,9,线性降维方法,主成分分析(PCA) Jolliffe, 1986PCA对于椭球状分布的样本集有很好的效果, 学习所得的主方向就是椭球的主轴方向. PCA 是一种非监督的算法, 能找到很好地代表所有样本的方向, 但这个方向对于分
3、类未必是最有利的,10,线性降维方法,线性判别分析(LDA) Fukunaga, 1991降维目的:寻找最能把两类样本分开的投影直线,使投影后两类样本的均值之差与投影样本的总类散度的比值最大求解方法:经过推导把原问题转化为关于样本集总类内散度矩阵和总类间散度矩阵的广义特征值问题,11,降维方法概述,线性降维主成分分析 (PCA) Jolliffe, 1986线性判别分析 (LDA) Fukunaga, 1991,12,降维方法概述,线性降维主成分分析 (PCA) Jolliffe, 1986线性判别分析 (LDA) Fukunaga, 1991多维尺度变换 (MDS) Cox, 1994,di
4、j,Mapping,原始空间,可能非欧式,低维欧式空间,13,线性降维方法的不足,原始数据无法表示为特征的简单线性组合比如:PCA无法表达Helix曲线流形,1-D Helix曲线流形,14,线性降维方法的不足,真实数据中的有用信息不能由线性特征表示比如:如何获取并表示多姿态人脸的姿态信息比如:如何获取运动视频序列中某个动作的对应帧,15,降维方法概述,线性降维传统非线性降维核主成分分析 (KPCA) Scholkopf, 1998主曲线 (Principal Curves) Hastie, 1989 Tibshirani, 1992自组织映射 (SOM) Kohonen, 1995产生式拓扑
5、映射 (GTM) Bishop, 1998,16,降维方法概述,基于流形学习的非线性降维保距特征映射 (ISOMAP) Tenenbaum, 2000局部线性嵌入 (LLE) Roweis, 2000拉普拉斯特征映射 (LE, Laplacian Eigenmap) Belkin, 2001Hessian LLE (HLLE) Donoho, 2003局部切空间对齐 (LTSA, Local Tangent Space Alignment) Zhang, 2004最大方差展开 (MVU/SDE, Maximum Variance Unfolding) Weinberger, 2004局部保持映
6、射 (Locality Preserving Projections) He, 2003,17,提纲,研究背景基本知识介绍经典方法概览总结讨论,18,流形学习框架,什么是流形?流形是线性子空间的一种非线性推广拓扑学角度:局部区域线性,与低维欧式空间拓扑同胚微分几何角度:有重叠chart的光滑过渡黎曼流形就是以光滑的方式在每一点的切空间上指定了欧氏内积的微分流形,19,流形的数学定义设 是一个Hausdorff拓扑空间,若对每一点 都有 的一个开邻域 和 的一个开子集同胚, 则称 为 维拓扑流形, 简称为 维流形.,流形学习框架,20,一些基本数学概念拓扑,Hausdorff 空间,坐标卡,微分
7、结构光滑函数,光滑映射,切向量,切空间参考文献陈省身, 陈维桓, 微分几何讲义. 北京大学出版社, 1983M Berger, B Gostiaux. Differential Geometry: Manifolds, Curves and Surfaces, GTM115. Springer-Verlag, 1974陈维桓, 微分流形初步(第二版). 高等教育出版社, 2001,流形学习框架,21,流形学习的目的流形学习是一种非线性的维数约简方法高维观察数据的变化模式本质是由少数几个隐含变量所决定的如:人脸采样由光线亮度、人与相机的距离、人的头部姿势、人的面部表情等因素决定从认知心理学的角度
8、,心理学家认为人的认知过程是基于认知流形和拓扑连续性的,流形学习框架,22,流形学习的数学定义,设 是一个低维流形, 是一个光滑嵌入,其中 Dd . 数据集 是随机生成的, 且经过 f 映射为观察空间的数据 流形学习就是在给定观察样本集 的条件下重构 f 和 .V. de Silva and J. B. Tenenbaum. Global versus local methods in nonlinear dimensionality reduction . Neural Information Processing Systems 15 (NIPS2002), pp. 705-712, 20
9、03.,23,非线性降维,高维数据空间data / observation space,低维嵌入空间embedding / coordinate space,保持一定几何拓扑关系,如测地距离/邻域线性重构关系,流形学习示例,24,提纲,研究背景基本知识介绍经典方法概览总结讨论,25,经典流形学习方法一览,26,经典方法分类结构图,27,等距映射(ISOMAP)J.B. Tenenbaum, V. de Silva, and J. C. Langford. A global geometric framework for nonlinear dimensionality reduction. S
10、cience, vol. 290, pp. 2319-2323, 2000.局部线性嵌入(LLE)S. T. Roweis and L. K. Saul. Nonlinear dimensionality reduction by locally linear embedding. Science, vol. 290, pp. 2323-2326, 2000.拉普拉斯特征映射(Laplacian Eigenmap)M. Belkin, P. Niyogi, Laplacian Eigenmaps for Dimensionality Reduction and Data Representat
11、ion. Neural Computation, Vol. 15, Issue 6, pp. 1373 1396, 2003 .,重点介绍的几个方法,28,等距映射(ISOMAP)J.B. Tenenbaum, V. de Silva, and J. C. Langford. A global geometric framework for nonlinear dimensionality reduction. Science, vol. 290, pp. 2319-2323, 2000.局部线性嵌入(LLE)S. T. Roweis and L. K. Saul. Nonlinear dim
12、ensionality reduction by locally linear embedding. Science, vol. 290, pp. 2323-2326, 2000.拉普拉斯特征映射(Laplacian Eigenmap)M. Belkin, P. Niyogi, Laplacian Eigenmaps for Dimensionality Reduction and Data Representation. Neural Computation, Vol. 15, Issue 6, pp. 1373 1396, 2003 .,重点介绍的几个方法,29,代表性算法-1,ISOMA
13、P (Isometric feature mapping)保持全局测地距离测地距离反映数据在流形上的真实距离差异等距映射基于线性算法MDS,采用“测地距离”作为数据差异度量,欧式距离 vs.测地距离,最短路径近似测地距离,降维嵌入空间,30,多维尺度变换 (MDS),MDS 是一种非监督的维数约简方法. MDS的基本思想: 约简后低维空间中任意两点间的距离应该与它们在原高维空间中的距离相同. MDS的求解: 通过适当定义准则函数来体现在低维空间中对高维距离的重建误差, 对准则函数用梯度下降法求解,对于某些特殊的距离可以推导出解析解法.,31,MDS的准则函数,32,MDS的示意图,33,MDS
14、的失效,34,测地线: 流形上连接两个点的最短曲线例如:球面上的测地线就是球面上的大圆弧测地距离:测地线的长度,Figure from http:/,测地距离,35,ISOMAP算法流程,1 计算每个点的近邻点 (用K近邻或 邻域).2 在样本集上定义一个赋权无向图 如果 和 互为近邻点, 则边的权值为3 计算图中两点间的最短距离, 记所得的距离矩阵为 .4 用MDS求低维嵌入坐标 , 令低维嵌入是 的第1大到第 d大的特征值所对应的特征向量.,36,M. Bernstein, V. Silva, J.C. Langford, J.B. Tenenbaum 证明了如下的渐进收敛定理.假设采样点
15、是随机均匀抽取的, 则 渐进收敛定理 给定 则只要样本集充分大且适当选择K , 不等式 至少以概率 成立.,图距离逼近测地距离,37,ISOMAP实验结果,Figures from ISOMAP paper,38,Figure from http:/isomap.stanford.edu/handfig.html,ISOMAP实验结果,39,Figures from ISOMAP paper,ISOMAP实验结果,40,Interpolation on Straight Lines in the Projected Co-ordinates,Figures from ISOMAP paper,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流形 学习 专题 介绍 ppt 课件

链接地址:https://www.31ppt.com/p-1359717.html