《管理统计学》第九章.ppt
第九章 普通相关分析,总体相关与样本相关偏相关品质相关,相关分析,变量之间的相关关系,确定型的关系函数关系,不确定型的关系相关关系,相关分析是研究变量之间不确定关系的统计方法。,其中最为常见的是两个或多个随机变量之间的线,性相关关系。,相关关系的内容有:,普通相关关系,品质相关,一、普通相关关系的种类,二、普通相关系数的种类及计算,三、普通相关系数的几何解释,五、普通相关系数的直观散点图,六、普通相关系数异于零的显著性检验,四、普通相关系数的取值范围,七、相关指数,普通相关关系,(一)按相关程度划分,完全相关,不完全相关,不相关,(二)按相关方向划分,正相关:同方向变动,负相关:反方向变动,(三)按相关形式划分,线性相关,非线性相关,(四)按变量多少划分,单相关:两变量间的相关,复相关,偏相关,(五)按相关性质划分,真实相关,虚假相关,Kendalls tua-b 相关系数,二、普通相关系数的种类及计算,总体相关系数,(一)积矩相关系数,样本相关系数,(参数相关),(二)等级相关系数,等级相关系数适用于顺序级和刻度级的配对样本。,(非参数相关),Spearman相关系数,(三)偏相关系数,(四)复相关系数,1.总体相关系数,2.样本相关系数,(一)积矩相关系数,适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。,1.Spearman相关系数,当n30时则计算统计量:,(二)等级相关系数,是一种非参数测度,根据数据的秩使用Pearson相关系数公式计算的,而不是根据实际值计算的。它适合有序数据或不满足正态分布假设的等间隔数据。,2.Kendalls tua-b 相关系数,当n30时则计算统计量:,V是利用变量的秩数据计算而得的非一致对数目。,(二)等级相关系数,第二中求法:,也是一种非参数测度,依然根据两个有序变量或两个秩变量间的关系程度的测度。但分析时考虑了节点,即秩次相同的点。,2.剔除了两个变量、的影响后,两个变量,式中,,(三)偏相关系数,1.剔除了一个变量Z的影响后,两个变量X、Y间,是普通相关系数。,x、y 之间的偏相关系数,(四)复相关系数,一个变量与多个变量之间的线性相关程度的指标。样本复相关系数的定义式如下:,图中,三、普通相关系数的几何解释,与,即,表示向量,一组,角的余弦就是配对样本,的相关系数。,的模。,样本,可以视为一个向量。,相关系数为0的两个随机变量,不相关,但不,一定相互独立。,相关系数为0的两个服从正态分布的随机变量,一定相互独立。,相互独立的随机变量间的相关系数,必然为0。,四、普通相关系数的取值范围,样本相关系数也是区间-1,1之间的一个量。,五、普通相关系数的直观散点图,设有配对样本观察值,与,则其直观散点图中,标是(,)。,每个点的平面坐,散点图,散点图(Graphs Scatter),散点图,Simple:简单散点图,显示两个变量关系的图;,Overlay:重叠散点图,显示多个配对变量关系的;,Matrix:矩阵散点图,以矩阵形式显示多个变量之间的关系;,3-D:三维散点图,显示三个变量关系的散点图。,检验的种类,偏相关系数的检验,六、相关系数异于零的显著性检验,(一)积矩相关系数的检验,式中,,是样本容量,,是简单相关系数(Pearson),检验统计量,积矩相关系数的检验,等级相关系数的检验,这是一个双尾检验问题,设定假设:,则拒绝,反之接受。,是剔除了的变量数,,是,式中,,是样本容量,,检验统计量:,(三)偏相关系数的检验,偏相关系数。,(二)等级相关系数的检验。同积矩相关系数。,七、相关指数,变量之间存在的非线性相关的强弱,难以用简单相关系数作判断。相关指数,是对非线性回归模型拟合时得到的可决系数。,普通相关分析的SPSS的实现过程:Analyze菜单Correlate项中选择Bivariate或Partial或Distances命令。,Correlation Coefficients:相关系数选择对话框,Pearson:简单相关系数,Kandells tu-b:相关系数,依据配对样本之差的正负号的个数,计算的相关系数。,Spearman:等级相关系数,Test of Significance:相关系数的显著性检验。正相关关系一般选择单尾,否则,一般选择双尾。,界面解释,Flag Significant Correlation:是否用星号标明输出结果的显著性。,Means and Standard Deviations:输出所选变量的均值、标准差和样本个数。,Cross Product Deviations and Covariances:输出平方和及协方差。,*问题的提出,*品质相关的实质,*Fisher判别法,*当只有一个自由度(且,)时Yete矫正法,*品质相关模式概括,*品质相关的判别方法,品质相关与SPSS处理,(1)不同文化程序的人对某一(些)政策的态度,是否相关?(2)不同富裕程度的农民对土地政策的态度,是否相关?(3)不同地区的人与不同工作作风,是否相关?(4)不同培训方法与培训后的业绩增长,是否相关?(5)不同经历的人与他们对某一问题的看法,是否相关?(6)不同层面的客户的偏好是否与产品不同包装相关?(7)不同民族与某种习惯是否相关?(8)不同观念(工作作风)与企业在不同领域的发展是否相关?等等。除此外,类似问题存农业、生物、医药科学中也有广泛的应用。例如,抽烟与癌症是否相关。饮食习惯与某种病症是否相关,都是会时常遇到的问题。,品质相关分析在社会科学中的用途很广,如:,表中,表示处于交叉位置的人数(总体中的个体数)。每个个体至少有2个特征(变量)。,品质相关模式概括,非要用品质相关来处理不可的问题,在个体的两个特征中,至少有一个是名义级的变量。,)的一组容量为n的样本,检验问题,就转化为检验:,区间,为,将,个区间,;,设,对任何两个随机变量x、y,如果,对任何,随机变量X、Y之间是相互独立的。,得到一个二维总体(,,,,,(,;,,,,,进而,将,的取值范围,分为,的取值范围分为s个区间,。,记,属于区间,并且,属于,区间,的概率,。,而,属于区间,的概率,。,为,。,于是,随机变量,,,之间是相互独立的,,,的概率为,。,属于,、,;,是否成立的问题,:,在假设,中,,与,都是未知参数,但是由于,知参数的个数是,。,,,共,,,,,个,少了两个自由度,,,所以,,,真正要估计的未,。,都成立则;,对显著性水平,接受备择假设,互独立(不相关),将,可以用极大似然法得出未知参数的估计值,,,于是转化为:,自由度是,对于本问题就是,在,的假设下,,:,。,“,”,与,的估计值代,试,就是各个交叉位置上的理想频次,”,若,则接受零假设,因素与状态相,则拒绝零假设,因素与状态显著相关。,入上式:,自由度是,。,“,。,,,,,。,,,,,,,中,如果总体,服从二维正态分布,参数均未知,与,相互独立,相互独立的检验问题是:,:,:,设,,为,的极大似然估计值,则,于是我们可以用,统计量来完成上述假设检验:,的显著性概率(外侧概率)与显著性水平,较,判断拒绝还是接受,这是一个双尾检验问题。,,,其中,那么,,,,,等价于,,,。,于是,,,计值,用统,比,。,的值产生较大偏,分布是连续的,偏差较大,时,由于,按照公式:,在自由度为1时,,,而这里处理的是离散问题,,,,,所计算的统计量的值,就会与,,,差,,,特别是在,,,,,需要矫正,。,给出了矫正公式,Yete,:,普通相关分析的SPSS的实现过程:Analyze菜单Correlate项中选择Bivariate或Partial或Distances命令。,品质相关分析的SPSS的实现过程:Analyze菜单Descriptive Statistics项中选择Crosstabs命令。,