商业数据分析·NMFppt课件.ppt
《商业数据分析·NMFppt课件.ppt》由会员分享,可在线阅读,更多相关《商业数据分析·NMFppt课件.ppt(18页珍藏版)》请在三一办公上搜索。
1、,商业数据分析,线性降维 : NMF,线性降维,2,NMFNonnegative Matrix Factorization非负矩阵分解,线性降维,在SVD的一些应用中,经常会出现一种情况,即:所有的元素都是大于等于0的。如上节课讲的文本处理例子,每个元素代表统计出来的词频,所以肯定都是非负的。对于这类问题,我们在进行降维的时候,可以利用他们的非负特征。这种降维方法被称为非负矩阵分解(Nonnegative matrix factorization),英文简写为NMF。,线性降维,NMF所涉及的矩阵分解方法,实际上是一个优化问题。也就是说,将原始的矩阵分解为两个非负矩阵的积。假设原矩阵X为一个n
2、p的矩阵,我们则寻找出一个nk的矩阵W,和kp的矩阵H,使得以下函数取得最小值:,线性降维,简单讲,非负矩阵分解,就是将非负矩阵X分解为两个更小的非负矩阵W和H相乘,即:之所以是约等于,是因为当前解法并非精确解,而只是数值上的近似解。其中r远小于n和m,一般情况下,(n+m)r nm。,线性降维,由公式可以看到,分解后的积并不一定完全等于原矩阵,但是要尽可能的接近,所以NMF是一种近似分解的方法。正因为如此,在计算中等式两者很难完全相等。在计算中往往是根据某更新法则迭代更新出两个乘子,当上式的距离小于我们设定的大小,停止迭代。,线性降维,经过非负矩阵分解后的两个矩阵也有着一些有意思的性质。 原
3、矩阵X中的一列向量可以解释为对左矩阵W中所有列向量(称为基向量)的加权和,而权重系数为右矩阵H中对应列向量中的元素。 这种基于基向量组合的表示形式具有很直观的语义解释,它反映了人类思维中“局部构成整体”的概念。,线性降维,常用的构建非负矩阵分解的算法有以下三种:1、乘法更新算法(Multiplicative Update Algorithm)2、交替最小二乘算法(Alternating Least Squares)3、梯度下降算法(Gradient descent algorithm)这里我们介绍前两种。,线性降维,步骤:1、初始化W为一个nk的矩阵,其中每一个元素都为0到1的随机数;2、初始
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商业 数据 分析 NMFppt 课件
链接地址:https://www.31ppt.com/p-1656694.html