统计案例常考知识点清单全知识点.doc
函数关系相关关系非线性相关正相关负相关散点图中点散布在从左下角到右上角下角到右上角不相关散点图中点散布在从左下角到右上角下角到右上角散点图中点散布大致在一条直线附近下角到右上角第三章、统计案例常考知识点清单一、线性回归分析1.两变量之间的关系线性相关(1)相关关系非确定性关系。对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。(2)函数关系确定性关系。2.线性回归直线方程为 3.求线性回归方程的步骤: 4.回归直线必过样本点的中心 5.线性回归模型线性回归模型是 ,这里y的值由x和随机变量e共同确定,即x只能解释部分y的变化,因此我们把x称为 ,y称为 a和b为模型的 e为 和 的误差。通常e为 ,称为 ,它的均值E(X)= .方差D(X)= ,这样线性回归模型的完整表达式为 6.产生随机误差的原因? 7.用身高预报体重需要注意的问题?7.残差 ;8.残差图: 为纵坐标,横坐标为 ,残差图的作用有两个,分别是 ;如果数据采集没有错误,则需要寻在其他原因。残差点比较均匀地 ,说明选用的模型比较合适;这样的的带状区域的宽度 说明模型拟合精度 ;回归方程的预报精度 。9.相关指数表示 对 的贡献,公式为: 的范围为 的值越大,说明残差平方和 ,说明模型拟合效果 .10.线性回归分析的完整步骤: 11.非线性回归分析的步骤: 二、独立性检验的基本思想及其初步应用1.分类变量: .2. 列联表: .3. 统计量= 4.用独立性检验的思想解决问题的步骤: 第三章、统计案例常考知识点检测试卷1.两个变量的关系有哪些?如何判断?2.线性回归直线方程为 .回归直线必过样本点 3.线性回归模型线性回归模型是 ,这里y的值由x和随机变量e共同确定,即x只能解释部分y的变化,因此我们把x称为 ,y称为 a和b为模型的 e为 和 的误差。通常e为 ,称为 ,它的均值E(X)= .方差D(X)= ,这样线性回归模型的完整表达式为 4.残差 ;5.残差图: 为纵坐标,横坐标为 ,残差图的作用有两个,分别是 ;如果数据采集没有错误,则需要寻在其他原因。残差点比较均匀地 ,说明选用的模型比较合适;这样的的带状区域的宽度 说明模型拟合精度 ;回归方程的预报精度 。6.相关指数表示 对 的贡献,公式为: 的范围为 的值越大,说明残差平方和 ,说明模型拟合效果 .10.线性回归分析的完整步骤: 7. 统计量= 8.用独立性检验的思想解决问题的步骤: 第三章、统计案例基础知识检验一题型一、基础概念1.下列说法正确的有( )回归方程适用于一切样本和总体。 回归方程一般都有时间性。样本取值的范围会影响回归方程的适用范围。回归方程得到的预报值是预报变量的精确值。A. B. C. D. 2.下列结论正确的是( ) 函数关系是一种确定性关系; 相关关系是一种非确定性关系 回归分析是对具有函数关系的两个变量进行统计分析的一种方法 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。A. B. C. D. 3.在两个变量的回归分析中,作散点图的目的是_。4.线性回归模型y=bx+a+e中,b=_,a=_e称为_ _ 5. 两个变量与的回归模型中,分别选择了4个不同模型,它们的相关指数如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数为0.98 B.模型2的相关指数为0.80 C.模型3的相关指数为0.50 D.模型4的相关指数为0.25题型二、有关回归方程问题1. 设有一个回归方程为y=2-2.5x,则变量x增加一个单位时( )A.y平均增加2.5个单位 B.y平均增加2个单位C.y平均减少2.5个单位 D.y平均减少2个单位2.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是 ( ) A. =1.23x4 B. =1.23x+5 C. =1.23x+0.08 D. =0.08x+1.233. 已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为y=bx+a必过( )A.(2,2)点 B.(1.5,0)点 C.(1,2)点 D.(1.5,4)点4. 为研究变量和的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程和,两人计算知相同,也相同,下列正确的是( )A. 与重合 B. 与一定平行 C. 与相交于点 D. 无法判断和是否相交5.变量与具有线性相关关系,当取值16,14,12,8时,通过观测得到的值分别为11,9,8,5,若在实际问题中,的预报最大取值是10,则的最大取值不能超过( )A.16 B.17 C.15 D.12题型三、有关综合问题1 .有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是 2、学校对校本课程人与自然的选修情况进行了统计,得到如下数据:那么,选修人与自然与性别有关的把握是 ;3、如图,有组数据,去掉 组(即填A,B,C,D,E中的某一个)后,剩下的四组数据的线性相关系数最大。 4、 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表患 病未患病总 计用 药40630670不用药30300330总计709301000能以97.5%的把握认为药物有效吗?为什么?6.假设关于某设备的使用年限和所支出的维修费用有如下的统计资料若由资料知对呈线性相关关系,试求:1)线性回归方程(2)估计使用年限为年时,维修费用大约是多少?