《统计案例》PPT课件.ppt
《《统计案例》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计案例》PPT课件.ppt(58页珍藏版)》请在三一办公上搜索。
1、10.4 统计案例要点梳理1.回归分析(1)定义:对具有 的两个变量进行统计 分析的一种常用方法.(2)随机误差:线性回归模型用y=bx+a+e表示,其 中a和b为模型的,称为随机误差.(3)样本点的中心 在具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中,回归方程的截距和斜率的最小二乘 估计公式分别为:,相关关系,未知参数,e,基础知识 自主学习,其中 称为样本点的中心.(4)相关系数,.,r=,当r 0时,表明两个变量;当r 0时,表明两个变量.r 的绝对值越接近于1,表明两个变量的线性相关性.r 的绝对值越接近于0时,表明两个变量之间.通常|r|大于 时,认为两个变
2、量有很强的线性相关性.,正相关,负相关,越强,几乎不存在线性相关关系,0.75,2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的,像这类变量称为分类变量.,不同类别,(2)列联表:列出两个分类变量的,称 为列联表.假设有两个分类变量X和Y,它们的可能 取值分别为x1,x2和y1,y2,其样本频数列联 表(称为22列联表)为22列联表,频数表,构造一个随机变量K2=,其中n=为样本容量.(3)独立性检验利用随机变量 来确定是否能以一定把握认为“两个分类变量”的方法称为两个分类变量的独立性检验.,a+b+c+d,K2,有关系,基础自测1.相关系数度量()A.两个变量之间线性相关关系的强
3、度 B.散点图是否显示有意义的模型 C.两个变量之间是否存在因果关系 D.两个变量之间是否存在关系 解析 相关系数来衡量两个变量之间线性相关关系的强弱.,A,2.如果有95%的把握说事件A和B有关系,那么具体计 算出的数据()A.K23.841 B.K26.635 D.K23.841,K26.635就约有99%的把握.,A,3.已知x、y之间的数据如表所示,则回归直线过点()A.(0,0)B.(,0)C.(0,)D.(,)解析 回归直线过样本点的中心(,).,D,4.下列说法中正确的有:若r0,则x增大时,y也相应增大;若r0,则x增大时,y也相应增大;若r=1或r=-1,则x与y的关系完全对
4、应(有函数关系),在散点图上各个点均在一条直线上()A.B.C.D.解析 若r0,表示两个相关变量正相关,x增大时,y也相应增大,故正确.r0,表示两个变量负相关,x增大时,y相应减小,故错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故正确.,C,5.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的(有关,无关).解析 K2=27.6310.828,有99.9%的把握认为“打鼾与患心脏病有关”.,有关,题型一 线性回归分析【例1】假设关于某种设备的使用年限x(年)
5、与所支出的维修费用y(万元)有如下统计资料:,已知(1)求,;(2)对x,y进行线性相关性检验;,x,题型分类 深度剖析,(3)如果x与y具有线性相关关系,求出线性回归方程;(4)估计使用年限为10年时,维修费用约是多少?(1)先根据已知计算相关系数r,判断是否具有相关关系.(2)再利用公式求出回归方程进行回归分析.解(1),思维启迪,(2)步骤如下:作统计假设H0:x与y不具有线性相关关系.n-2=3时,r0.05=0.878.=112.3-545=12.3,=90-542=10,=140.8-125=15.8,r=|r|=0.9870.878,即|r|r0.05,所以有95%的把握认为“x
6、与y之间具有线性相关关系”,去求线性回归方程是有意义的.,所以线性回归方程为=1.23x+0.08.(4)当x=10时,=1.2310+0.08=12.38(万元),即估计使用10年时,维修费用约为12.38万元.在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系.若它们之间具有相关关系,再求回归方程,否则,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的.,探究提高,知能迁移1 测得某国10对父子身高(单位:英寸)如下:,(1)对变量y与x进行相关性检验;(2)如果y与x之间具有线性相关关系,求线性回归方程;(3)如果父亲的身高为73英寸,估计儿
7、子的身高.,解(1),因为r的值较大,所以y与x之间具有很强的线性相关关系.(2)设回归方程为,故所求的回归方程为=0.464 6x+35.974 7.(3)当x=73时,=0.464 673+35.974 769.9.所以当父亲身高为73英寸时,估计儿子身高约为69.9英寸.,题型二 非线性回归分析【例2】下表是某年美国旧轿车价格的调查资料,以x表示轿车的使用年数,y表示相应的年均价格,求y关于x的回归方程.,由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但不在一条直线附近.但据此认为y与x之间具有线性相关关系是不科学的,要根据图形的形状进行合理转化,转化成线性关
8、系的变量间的关系.,思维启迪,解 作出散点图如图所示.,可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用 来刻画题中模型更为合理,令,则,题中数据变成如下表所示:,相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.,由表中数据可得r-0.996.|r|0.75.认为x与z之间具有线性相关关系,由表中数据得-0.298,8.165,所以=-0.298x+8.165,最后回代=ln,即=e-0.298x+8.165为所求.非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学
9、过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.,探究提高,知能迁移2 在试验中得到变量y与x的数据如下表:,试求y与x之间的回归方程,当x0=40时,预测y0的值.解 作散点图如图所示,从散点图可以看出,两个变量x,y不呈线性相关关系.根据学过的函数知识,样本点分布的曲线可能有两种情况.,(1)指数函数曲线y=c1;(2)二次函数曲线y=c3x2+c4.对于(1),问题变为如何估计待定参数c1,c2,可通过对数变换把指数关系变为线性关系,那么令则,作散点图如图所示.,列表,从图中可以
10、看出x与z有很强的线性相关性.由表中的数据得到线性回归方程=0.277x-3.992.所以,变量y关于x的指数回归方程为=e0.277x-3.992.对于(2),问题变为如何估计待定参数c3,c4,那么令t=x2,则y=c3t+c4.列表,从图中可以看出,y与t不宜用线性回归方程来拟合.,为比较两个模型的拟合效果,用线性回归模型拟合表中的数据,可得到y关于t的线性回归方程为 0.357t-177.08.所以,变量y关于x的二次回归方程为 0.357x2-177.08.利用残差比较两个回归方程的拟合效果.,列表,计算残差平方和 812.759,13 669.063.因此,指数模型的拟合效果远远优
11、于二次模型,应选用指数模型.所以,当x0=40时,y0=e0.27740-3.9921 197.510.,题型三 独立性检验【例3】(12分)在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?(1)先由已知作出调查数据的列联表.(2)再根据列联表画出二维条形图,并进行分析.(3)利用独立性检验作出判断.,思维启迪,解 根据题目所给的数据作出如下的列联表:,4分根据列联表作出相应的二维条形图,如图所示.,6分,从二维条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例 要大,其差值为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计案例 统计 案例 PPT 课件

链接地址:https://www.31ppt.com/p-5590055.html