《 统计案例》.docx
统计案例统计案例zdj ì ìììy=bx+a+eïïï(1)表达式ï,其中e为随机变量,称为随机误差,x是解释变量,y是预报变量;íïï2ïïîE(e)=0,D(e)=dïïïïïïìïïïïïïL(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,L,n,(x2,y2),ïï定义:对于样本点(x1,y1),ïïïïµ=y-µ$-a$,i=1,2,L,n,则eµ称为相应于点(x,y)的残差;ïïyi=yi-bxï(2)残差í 其估计值为eiiiiiiïïïïïïìïï>利用残差可以发现数据中的错误;ïïï作用íïïïïïî>利用残差可以衡量模型的拟合效果;îïïïïnì2ïïïµy-yåïïïiiïïïï2i=1ï;ï公式:R=1-nïï线性ï2ïïïåyi-yïïï回归í相关ïi=1ïïïïïn2ï回ï模型ï(3)指数í2µ作用:R越大,则残差平方和y-yåï归ïii越小,即模型的拟合效果越好;ï2ïRïíi=1ïïï分ïïïn2ï析ïï R2越小,则残差平方和åy-µïyii越大,即模型的拟合效果越差;ïïïïi=1ïïïïïïïïîïïïïïì>确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;ïïïïïïïï建立ï>画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等);ïïïï4回归方程()ïïí>由经验确定回归方程的类型;ïïïï步骤ï>按一定规则(如最小二乘法)估计回归方程中的参数;ïïï统ïïïïïî>得出结果后分析残差图是否异常,模型是否合适等;ïî计ïí案ïïì(1)作出散点图后,这些点分布在某一条曲线附近;ïï例ïïì>分别求出各自的回归方程;ïï非线性ïïí拟合效果ïïïï2回归模型2()í>分别求出各自的相关指数R;ïïï比较ïïïï2ï>比较R大小,得出结论;ïïîîîïïì(1)分类变量的概念:取不同“值”表示个体所属的不同类别的变量;ïïïï(2)列联表:列出两个分类变量的频数的表格;ïïìÄ频率分析;ïïïïïïÄ图形分析(如等高条形图);ïïïïï2ìïn(ad-bc)ïï2ï>定义:利用随机变量K=(其中n=a+b+c+d)来判断ïïïa+bc+da+cb+d()()()()ïïïïïïï独ïï ?ïïïïïï立ïì>作出列联表;独ïïï判断两个ïïïïï性íï立ïï>进行统计假设,即“假设两个分类变量X与Y没有关系”;3分类变量()íï检ïïï>确定容许推断“两个分类变量X与Y有关系”犯错误的上界a,查表确定临界值k;0ïï相关关系ïÄ性íïïïïï验ï2ï检ï步骤í>计算K的观测值k;ïïïï验ïïïï>判断k与k0的大小:ïïïïï 若k³k,就推断“X与Y有关系”,这种推断犯错误的概率不超过a; ïïïï0ïïïïïï 若k<k0,就认为在犯错误的概率不超过a的前提下,不能推断“X与Y有关系”;ïïïïîïïïïïïïïîïïïïïïîïïîîï()()()()21