《交叉验证法》PPT课件.ppt
1.Introduction,主成分分析Principal Component Analysis,2.PCA,3.CV,1.Introduction,Necessary Knowledge,线性代数,1.2 Necessary Knowledge on Linear Algebra,1.1 矢量Vector,1.2 线性相关,1.3 矩阵Matrix,1.4 秩Rank,BACK,矢量:n个有顺序的数a1,a2,an组成的数组。,k11+k22+kmm=0,线性组合:k1+k2。就称为,的,行矢量:(a1,a2,an);列矢量t。,问:由,组成的矩阵,rank最大为几?,1=(1 2 3 4 5 6)2=(6 5 4 3 2 1)3=(1 1 1 1 1 1),1+23=0,Four students three professortwo subject:Chemistry and English,3教授给4学生写留学推荐信,矩阵的秩:对于A(mn),其秩是A中 最大线性无关的行数(或列数)。,秩组分数?,秩为几?三种组分,吸收光谱各不相同(s1,s2,s3)6组溶液,各组分浓度不同 吸光度矩阵A(206),Rank=Number of Eigenvalue,秩=不为0的特征值的数目,Eigenvalue 特征值,奇异值分解法:Y=USVt S:对角矩阵,收集了Y的特征值 U:标准列正交矩阵(Scores Matrix)Vt:标准行正交矩阵(Loadings Matrix)用Matlab 很方便!一句话!,BACK,2.PCA 主成分分析 Principal Component Analysis,2.1 目的1,2.2 基本步骤2,2.3 应用实例3,2.1 主成分分析(PCA)的目的,BACK,现代仪器获得两维数据(矩阵),矩阵处理确定秩为多少,确定复杂分析体系中的物种数,PCA的目的-定性有几种物种species,定性,2.2 PCA的步骤,BACK,矩阵分解,真实误差法,收集特征值,特征值比值法,Y=USVt,在S中,比较RSD与RE,Max,BACK,NIPALS分解,矩阵分解,Y=TP,S:对角矩阵,收集了Y的特征值 U:标准列正交矩阵(Scores Matrix)Vt:标准行正交矩阵(Loadings Matrix)用Matlab 很方便!一句话!,分解成正交矩阵的乘积,Y(mn)有d个主成分,真实误差法-确定主成分数d,=,真实误差RE(Real Error,可以知道),RE=RSD(剩余标准偏差)Residual Standard Deviation,确定或设定RE,d=1n-1计算RSD(d),YES,此时d即为主成分数,BACK,相邻特征值比值法,出现最大值时相应的d,显著差异,BACK,2.3 PCA的应用实例,BACK,混合色素中组分数的确定,一组食用色素混合溶液,测得吸光度矩阵Y156,PCA结果,组分数 nc=3,722的噪声水平0.002,3 0.6145 64.0 0.0017,PCA结果,组分数 nc=3,噪声水平0.0002,3 0.199 64.3 0.0004,实际上有3种色素胭脂红柠檬黄日落黄,反过来,已知主成分数时,PCA:通常可以正确判定主成分数,根据RSD,BACK,PCA确定组分数,Y=load(E:Hp8453BBOH15.txt);U,S,V=svd(Y);lmd=diag(S);n=size(lmd,1);for k=1:n-1 sumlmd=0;for j=(k+1):n sumlmd=sumlmd+lmd(j)*lmd(j);end RSD(k)=sqrt(sumlmd/(nw*(nt-k);end,PCA:Conclusions,根据矩阵的秩确定化学成分数,BACK,3.Cross Validation,PCR,LOO,PCR:基本步骤,SVD分解,SVD分解,分离,重组,广义逆,建模,未知样预报,与K矩阵法相比仅一次求逆过程剔除了主成分模型误差系数矩阵P意义不明确但用于预报是正确的,BACK,Y:波长数nw=8;溶液数ns=6;组分数nc=3,广义逆矩阵,什么是交叉验证?,配置6份标准溶液,测得吸光度矩阵,For i=1:n每次取出一条做未知剩下5个来建模,LOOLeave one out,看matlab程序,这是今天的作业,数据在这里:文件名 2zufen.txt,手工记录后回去重现,今天的word文档作业:,描述基于主成分分析的交叉验证法原理、步骤、目的,考试为每次word文档的汇总,