一组空气污染数据的主成分分析.doc
《一组空气污染数据的主成分分析.doc》由会员分享,可在线阅读,更多相关《一组空气污染数据的主成分分析.doc(14页珍藏版)》请在三一办公上搜索。
1、一组空气污染数据的主成分分析【说明】下面的多元统计分析练习题摘自R.A. Johnson等编写的应用多元统计分析(第五版),原书为:Richard A. Johnson and Dean W. Wichern. Applied Multivariate Statistical Analysis (5th Ed). Pearson Education, Inc. 2003。我看的是中国统计出版社(China Statistics Press)2003年发行的影印本。第一题为原书第1.6题,即第1章的第6题,第二题为原书第8.12题,即第8章的第12题。第二题用的是第一题的数据。1 习题1.6.
2、The data in Table 1.5 are 42 measurements on air-pollution variables recorded at 12:00 noon in the Los Angeles area on different days.(a) Plot the marginal dot diagrams for all the variables.(b) Construct the , Sn, and R arrays, and interpret the entries in R. TABLE 1.5 AIR-POLLUTION DATAWind (x1)So
3、lar radiation (x2)CO (x3)NO (x4)NO2 (x5)O3 (x6)HC (x7)898721282710743953710343563108852815469142810389052121249847412155572642114478251111138645213946715410336914212737727418103107042117310724181039774191038764177387153164496742132396933953106253144498842763880421311453033523683511023488432763678421
4、111387921710366243983103731723871411073752411284548658436754110243103541692885419102586316122586721318277974925377952862668621114384043652Source: Data courtesy of Professor G.C. Tiao.8.12. Consider the air-pollution data listed in Table 1.5. Your job is to summarize these data in fewer than p=7 dime
5、nsions if possible. Conduct a principal component analysis of the data using both the covariance matrix S and the correlation matrix R. What have you learned? Does it make any difference which matrix is chosen for analysis? Can the data be summarized in three or fewer dimensions? Can you interpret t
6、he principal components?2 部分解答2.1 部分统计参数利用Excel计算的平均值()和标准差WindSolar radiationCONONO2O3HCAverage7.573.8571434.5476192.190476210.0476199.40476193.0952381Stdev1.581138817.3353881.23372091.08735743.37098375.56583450.6917466Excel给出的协方差矩阵SWindSolar radiationCONONO2O3HCWind2.4404762Solar radiation-2.71428
7、6293.36054CO-0.3690483.81632651.4858277NO-0.452381-1.3537410.65759641.154195NO2-0.5714296.60204082.25963721.062358311.092971O3-2.17857130.0578232.7545351-0.7913833.052154230.24093HC0.16666670.60884350.1383220.17233561.01927440.58049890.4671202Excel给出相关系数矩阵RWindSolar radiationCONONO2O3HCWind1Solar ra
8、diation-0.1014421CO-0.1938030.18279341NO-0.269543-0.0735690.50215251NO2-0.1098250.1157320.55658380.29689811O3-0.2535930.31912370.4109288-0.1339520.16664221HC0.15609790.05201040.16603230.23470430.44776780.15445061从相关系数矩阵可以看出,CO与NO、NO2相关性明显,O3与Solar radiation、CO相关性明显。后面的主成分分析将CO与NO、NO2归并到一个主成分,将O3与Sol
9、ar radiation归并到一个主成分,将HC、Wind归并到一个主成分。HC与Wind的相关系数并不高,但从正相关的角度看,二者的数值倒是最高的。方差极大正交旋转之后,HC与CO、NO、NO2归并到一个因子,因为HC与NO2的相关系数较高,与CO、NO的相关系数高于其他变量。2.2 主成分分析之一数据未经标准化下面是从相关矩阵R出发,SPSS给出的结果。原始数据未经标准化。所谓从R出发,就是在SPSS的Factor Analysis: ExtractionAnalysis选项中选中Correlation Matrix。SPSS给出的相关系数矩阵(Correlation Matrix),与E
10、xcel计算的结果一样。公因子方差(Communalities)表如下。公因子方差变化于0.5440.795之间,相差不是很大。但是,公因子方差值没有达到0.8以上的,可见每一个变量体现在三个主成分中的信息都不超过80%。特征根与方差贡献(Total Variance Explained)如下表。可见提取三个主成分可以解释原来7格变量的70.384%。主成分载荷矩阵(Component Matrix)见下表。将上表从SPSS中复制到Excel中,进行涂色分类,结果如下表所示。Component123WIND-0.362020.3278090.706084Solar radiation0.314
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一组 空气污染 数据 成分 分析
链接地址:https://www.31ppt.com/p-2826982.html