市场调查数据的数理推断分析.ppt
《市场调查数据的数理推断分析.ppt》由会员分享,可在线阅读,更多相关《市场调查数据的数理推断分析.ppt(81页珍藏版)》请在三一办公上搜索。
1、市场调查数据的数理推断分析,第5章,1,本章主要介绍利用 Excel 进行数据推断的方法,包括参数估计、假设检验、方差分析、相关和回归分析。所使用的函数为 RAND。,本章简介,本章重点,重点、难点,参数估计,假设检验,相关和回归分析。,本章难点,使用数据分析工具进行数据推断分析。,2,本章目录,3,5.1.2 使用随机数生成函数实现随机抽样,5.1.1 利用 EXCEL数据分析功能实现随机抽样,5.1 随机抽样,4,5.1.1 利用EXCEL数据分析功能实现随机抽样,实现随机抽样有两种方法:,利用 Excel 数据分析功能实现随机抽样。,使用随机数生成函数实现随机抽样。,例5-1,图5-1
2、是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:,第一步:选择“工具”菜单下“数据分析”中“抽样”功能,打开“抽样”对话框,如图 5-2 所示。,例5-1,图5-1 是80 名学生的考试成绩数据,从中随机抽取 20 人的成绩数据作样本。具体的操作步骤如下:,第二步:设置相关参数,如图 5-2 所示,单击“确定”按钮。,8,利用 Excel“数据分析”提供的抽样功能抽取的样本存在以下问题:,1,2,随机抽样采用的是可放回抽样,因此,总体中的每个数据都可以多次被抽中,所以样本中的数据一般都会有重复现象。,经过筛选,抽样结果避免了重复,但最终所得样本数量可能
3、少于所需数量,因而要根据经验适当调整在数据样本选取时的数量设置,以使筛选后的样本数量满足要求。,3,尽管高级筛选可以对重复抽样情况进行修补,但抽样结果只能输出所需数目的所抽选项,其他相关信息需要利用其他辅助手段得到,给后继数据分析带来困难。,5.1.2 使用随机数生成函数实现随机抽样,利用随机数函数 RAND()进行随机抽样,上例数据利用 RAND函数抽样的操作步骤为:,第一步:增加字段“生成随机数”和“随机数排序”。,第二步:在单元格 F2 中输入公式“=RAND()”,并复制到单元格区域 F3:F81,得到一列动态随机数。如图 5-5 所示。,第三步:选择单元格区域 F2:F81,单击鼠标
4、右键,选择“复制”,移动光标到单元格 G2,再次单击鼠标右键,选择“选择性粘贴”,在出现的对话框中选择“数值”并单击“确定”,得到一列静态随机数。,第四步:选择单元格区域 A1:G81,选择“数据”“排序”,以“随机数排序”为主要关键字排序。在排序结果中根据所需样本数目,即可以进行进一步数据推断。,5.2.2 均值区间估计,5.2.1 参数估计概述,5.2 总体参数估计,5.2.3 比率区间估计,11,参数估计概述,参数估计是指用样本指标(也称为统计量)来估计未知的总体指标(也称为总体参数)。最常见的是用样本平均数估计总体均数、用样本比率估计总体比率。,点估计也称为定值估计,是以样本指标的实际
5、值直接作为总体未知参数的估计值的一种推断方法。,区间估计是给出总体未知参数的可能变动范围,即区间,并用一定的概率保证区间包含总体未知参数,即根据统计量和标准误差推断总体指标的可能范围。,均值区间估计,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第一步:建立均值区间估计计算表,如图 5-7 所示。,15,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1
6、)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第二步:总体方差已知的区间估计:在单元格B24 中输入已知总体标准差“10”,在单元格 B25中输入置信水平“95%”,在单元格 B26 中输入样本容量“20”,在单元格 B23 中输入公式“=AVERAGE(C2:C21)”,计算样本均值;在单元格B27 中输入公式“=ABS(NORMSINV(1-B25)/2)”,计算正态分布临界值;在单元格 B28、B29 中分别输入公式“=B23-B27*B24/SQRT(B26)”,“=B
7、23+B27*B24/SQRT(B26)”,计算均值区间的下限和上限。,例5-2,假设学生成绩分布服从正态分布,根据例 5-1 抽出 20 名学生样本数据,(1)若数学成绩方差为 100,估计 80 名学生数学平均分 95%的置信区间。(2)总体方差未知,估计80 名学生数学平均分 95%的置信区间。具体的操作步骤如下:,第三步:总体方差未知的区间估计:在单元格D25 中输入置信水平“95%”,在单元格 D26 中输入样本容量“20”,在单元格 D23 中输入公式“=AVERAGE(C2:C21)”,计算样本均值;在单元格D24 中输入公式“=STDEV(C2:C21)”,计算样本标准差;在单
8、元格 D27 中输入公式“=TINV(1-D25,D26-1)”,计算 t 分布临界值;在单元格 D28、D29中分别输入公式“=D23D27*D24/SQRT(D26)”,“=D23+D27*D24/SQRT(D26)”,计算均值区间的下限和上限。,比率区间估计,比率在大样本情况下,服从正态分布分布,比率的区间估计为:,例5-3,某市区随机调查了 300 名居民户,其中 6户拥有等离子电视机,估计该地区等离子电视机 95%的置信区间。具体的操作步骤如下:,第一步:建立比率区间估计的计算表,如图 5-8所示。第二步:在单元格 B4 中输入公式“=B3/B2”,计算样本比率;在单元格 B7中输入
9、公式“=ABS(NORMSINV(1-B6)/2)”,计算正态分布临界值。第三步:在单元格 B8、B9 中分别输入公式“=B4-B7*SQRT(B4*(1-B4)/B5)”,“=B4+B7*SQRT(B4*(1-B4)/B5)”,计算比率置信区间下限和上限。,5.3.2 一个总体参数假设检验,5.3.1 假设检验概述,5.3 总体参数假设检验,5.3.3 两个总体参数假设检验,20,假设检验概述,1.假设检验,假设检验是推断分析的另一项重要内容,它与参数估计类似,但角度不同。参数估计是利用样本信息推断未知总体参数,而假设检验是先对总体参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否
10、成立的过程。假设检验有参数检验和非参数检验两种。逻辑上运用反证法,统计上依据小概率事件不可能发生这一原理。,假设检验概述,2.原假设与备择假设,统计是对总体参数的具体数值所作的陈述。在假设检验中,有原假设与备择假设。原假设是研究者想收集证据予以反对的假设,又称“零假设”,用符号表示为 H 0。之所以用零来修饰原假设,是因为原假设的内容总是没有差异或没有改变,或变量间没有关系等。关于样本统计量,如样本均值或样本均值之差的零假设,是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或者是否相等。备择假设也称“研究假设”,是研究者想收集证据予以支持的假设,表示为 H1。,假设检验概述,3.双侧
11、检验与单侧检验,如果备择假设没有特定的方向性,并含有符号“”,这样的检验称为双侧检验或双尾检验(图 5-9)。如果备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验。备择假设的方向为“”,称为左侧检验(图 5-10).备择假设的方向为“”,称为右侧检验(图 5-11)。,图5-9双侧假设检验,图5-10 左侧假设检验,图5-11右侧假设检验,假设检验概述,4.显著性水平,在假设检验中,把拒绝 H0 所犯的错误称为弃真错误(或类错误),发生的概率设为,也称显著性水平;把接受不真实的 H0 所犯的错误,称为取伪错误(或类错误),发生的概率设为,两者之间的关系是:大,就
12、小;小,就大,一般力求在控制 的前提下减少。显著性水平 的通常取值有 0.1、0.05、0.001 等。如果犯类错误损失更大,为减少损失,值取小;如果犯类错误损失更大,值取大。确定了,就确定了临界点。,假设检验概述,5.检验统计量与拒绝域,检验统计量是根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量。标准化检验统计量(点估计量假设值)点估计量的标准差,是对样本估计量的标准化结果,即原假设 H0 为真时,点估计量的抽样分布。双侧检验的拒绝域如图5-9 所示,左侧检验的拒绝域如图 5-10 所示,右侧检验的拒绝域如图 5-11所示。,图5-9双侧假设检验,图5-10 左
13、侧假设检验,图5-11右侧假设检验,假设检验概述,6.假设检验的步骤,根据已知总体与样本陈述原假设和备择假设。确定一个适当的检验统计量,并利用样本数据算出其具体数值。确定一个适当的显著性水平,并计算出其临界值,指定拒绝域。将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域内,拒绝 H,否则不拒绝 H。也可以直接利用 P 值作出决策,P 值,拒绝 H。,一个总体参数假设检验,表5-2 一个总体均值检验类型,1.一个总体均值检验,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分
14、,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第一步:建立如图 5-12所示的总体均值检验表。第二步:在单元格区域 B7:D8,B15:D16 设置检验形式。其中,(1)为双侧检验,(2)为左侧检验,(3)为右侧检验。在单元格 B4 输入例 5-2 计算样本标准差。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第三步
15、:总体方差已知的情况下,在单元格区域 B10:D10 分别输入公式“=NORMSINV(1B9/2)”,“=NORMSINV(B9)”,“=NORMSINV(1B9)”,计算三种检验临界值。在单元格 B11 中输入公式“=(B280)/(B3/SQRT(20)”,计算检验统计量。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第三步:在单元格区域B12:D12 分别输入公式“=
16、IF(ABS(B11)B10,”平均分不为 80 分“,”平均分为 80 分“)”,“=IF(B11D10,平均分高于80 分,平均分不高于 80 分)”,进行检验决策。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第四步:总体方差未知情况下,在单元格区域 B18:D18 分别输入公式“=TINV(B17,19)”,“=-TINV(2*C17,19)”,“=TINV(2*C1
17、7,19)”,计算三种检验临界值。在单元格 B19 中输入公式“=(B280)/(B4/SQRT(20)”,计算检验统计量。,例5-4,利用例 5-1 的抽样数据,在总体方差已知为 100 和总体方差未知两种情况下,显著性水平为 0.05 时,检验:(1)学生数学平均分是否为 80 分,(2)学生数学平均分是否低于 80 分,(3)学生数学平均分是否不高于 80 分。具体的操作步骤如下:,第四步:在单元格区域 B20:D20 分别输入公式“=IF(ABS(B19)B18,”平均分不为 80 分“,”平均分为 80 分“)”,“=IF(B19D18,平均分高于 80 分,平均分不高于 80分)”
18、,进行检验决策。,一个总体参数假设检验,表5-3大样本下一个总体比率检验类型,2.一个总体比率假设检验,例5-5,一种以休闲娱乐为主题的杂志声称其读者群中女性读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.05 下检验杂志社的声称是否属实。具体的操作步骤如下:,第一步:建立图 5-13 所示的比率检验计算表,例5-5,一种以休闲娱乐为主题的杂志声称其读者群中女性读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.
19、05 下检验杂志社的声称是否属实。具体的操作步骤如下:,第二步:在单元格 B2 中输入“=146/200”,计算样本比率。根据题目,该检验为左侧检验,在单元格区域 B3、B4 中设置原假设和备择假设。在单元格 B6 中输入公式“=NORMSINV(0.05)”,计算检验临界值,在单元格 B7 中输入公式“=(B2-80%)/SQRT(80%*(180%)/200)”,计算检验统计量。,例5-5,一种以休闲娱乐为主题的杂志声称其读者群中女性读者不低于 80%。为检验这一说法是否属实,某研究部门抽取了一个 200 人的样本,发现有 146 名女性经常阅读该杂志,在显著性水平为 0.05 下检验杂志
20、社的声称是否属实。具体的操作步骤如下:,第三步:在单元格 B8 中输入公式“=IF(B7)B6,不属实,属实)”,进行决策。,一个总体参数假设检验,表5-4一个总体方差检验类型,3.一个总体方差检验,例5-6,啤酒生产企业采用自动生产线灌装啤酒,每瓶装填量为 640 mL,但由于受某些不可控制因素影响,每瓶装填量会有差异。装填量太多或太少要么企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过也不应低于 4 mL。企业质监部门抽取了 10 瓶啤酒检验,得到样本标准差为 3.8 mL,以显著性水平为 0.1检验装填量标准差是否符合要求。具体的操作步骤如下:,第一步:建立图 5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场调查 数据 数理 推断 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6278676.html