统计学上机实验课6.ppt
《统计学上机实验课6.ppt》由会员分享,可在线阅读,更多相关《统计学上机实验课6.ppt(136页珍藏版)》请在三一办公上搜索。
1、统计学上机实验课,实验一:数据整理中的统计计算实验二:数据筛选与数据排序实验三:数据的整理与显示实验四:抽样推断中的统计计算实验五:相关与回归分析中的统计计算实验六:描述统计工具的综合使用,课程安排,一、实验要求1、已学习教材相关内容,理解数据整理中的统计计算问题;已阅读本次实验导引,了解Excel中相关的计算工具。2、准备好一个统计分组问题及相应数据(可用本实验导引所提供问题与数据)。3、以Excel文件形式提交实验报告(含:实验过程记录、疑难问题发现与解决记录(可选)。此条为所有实验所要求,恕不赘述。,实验一:数据整理中的统计计算,数据录入与数据清单的建立,操作步骤:,输入相关的文字与数据
2、,建立如下的数据清单。进行文字的基本修饰选择“对齐”选项卡,在“文本控制”栏选中“合并单元格”复选框。再选择“字体”选项卡,选择“字体”为“黑体”,“字形”为“加粗”,“字号”为“14”,颜色为“蓝色”。单击“确定”。接着选中 A2:E9 区域,按照上面的方法,设置“字号”为“10”,字体保持“宋体”不变。最后分别选择A2:E2、A3:A9、B9:E9区域,将该区域内的“字形”设置为“加粗”。修饰后的结果如下图:,步骤:,在单元格D3中输入公式“=B3-C3”,按“Enter”键。将光标移到D3 单元格的右下角,使得光标由“白十字”变成“黑十字”,按住鼠标(注意:未加特别说明,均指按住鼠标左键
3、)不放,向下拖动到D8单元格,将单元格D3 的公式复制到D4:D8单元格区域。,步骤:,在单元格E3中输入公式“=D3/B3”,按“Enter”键。将光标移到E3 单元格的右下角,使得光标由“白十字”变成“黑十字”,按住鼠标不放,向下拖动到E8 单元格,将单元格E3的公式复制到E4:E8单元格区域。,统计一些常用函数,样本容量 COUNT算数平均数 AVERAGE中位数 MEDIAN众数 MODE标准差 STDEV方差 VAR四分位数 QUARTILE偏度系数 SKEW峰度系数 KURT最大值 MAX最小值 MIN总和 SUM,步骤:,单击D9 单元格,选择菜单“插入|函数”,弹出“插入函数”
4、对话框。在“统计”函数类别中选择统计函数“AVERAGE”。单击“确定”。在“AVERAGE”函数的“函数参数”对话框中输入需要计算平均数的区域D3:D8,单击“确定”,得到最终结果。,注意:,在Excel 中对单元格进行操作往往有多种方法。常见情形下可以分为菜单操作、命令按钮操作、鼠标右键的快捷方式等等,后面将进一步说明。比如此例中利润率一般用百分数表示,此时可以选择单元格区域E3:E8,单击鼠标右键,在右键菜单中选择“设置单元格格式”,弹出“单元格格式”选项卡,在“分类”下选择“百分比”,单击“确定”。即可以将“利润率”用百分数来表示。,二、实验内容和操作步骤(一)问题与数据在一批灯泡中随
5、机抽取50只,测试其使用寿命,原始数据如下(单位:小时):进行等距分组,整理成频数分布表,并绘制频数分布图(直方图、折线图、曲线图)。,(二)使用FREQUENCY函数绘制频数分布表操作步骤:1、在单元区域A2E11中输入原始数据。2、并计算原始数据的最大值(在单元格B12中)与最小值(在单元格D12中)。3、根据Sturges经验公式计算经验组距(在单元格B13中)和经验组数(在单元格D13中)。4、根据步骤3的计算结果,计算并确定各组上限、下限(在单元区域F2G8中)。步骤14如图1-1所示。,图1-1 组数和组距的确定,5、绘制频数分布表框架,如图1-2所示。,图1-2 频数分布表框架,
6、6、计算各组频数:(1)选定B20B26作为存放计算结果的区域。(2)从“插入”菜单中选择“函数”项(或“单击常用工具栏”中的“插入函数”按钮)。(3)在弹出的“插入函数”对话框中选择“统计”函数FREQUENCY。步骤(1)(3)如图1-3所示。,图1-3 选择FREQUENCY函数,(4)单击“插入函数”对话框中的“确定”按钮,弹出“FREQUENCY”对话框。(5)确定FREQUENCY函数的两个参数的值。其中:Data-array:原始数据或其所在单元格区域(A2E11)Bins-array:分组各组的上限值或其所在的单元格区域(G2G7)。步骤(4)(5)如图1-4所示。,图1-4
7、确定FREQUENCY函数的参数,(6)按Shift+Ctrl+Enter组合键,结果图1-5所示。,图1-5 FREQUENCY函数计算结果,4、用各种公式计算表中其它各项,结果如图1-6所示。,图1-6 频数分布表中的其他计算,5、作频数分布图使用EXCEL的“图表向导”工具即可(操作步骤略),结果如图1-71-9所示。,图1-7 频数分布直方图,图1-8 频数分布折线图,图1-9 频数分布曲线图,作业,一人在十字路口统计考察通过该路口的行人人数,经过连续天的观察,统计结果如下:26 53 32 37 48 60 35 37 41 26 39 48 25 33 43 47 40 50 40
8、 26 32 37 42 46 33 33 22 58 63 45 28 61 37 29 44 42 47 25 38 43 39 51进行等距分组,整理成频数分布表,并绘制频数分布图(直方图、折线图、曲线图)。,一、数据筛选数据筛选包括两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。下面举例说明Excel进行数据筛选的过程。,实验二:数据筛选与数据排序,表2-1 8名学生的考试成绩数据单位:分,表2-1是八名学生四门课程的考试成绩数据,使用Excel“筛选”命令分别找出统计成绩等于75分的学生;英语成绩
9、前三名的学生;数学成绩大于80小于90的学生;统计成绩和数学成绩大于80分,或者英语成绩大于90分的学生。Excel提供了两种筛选命令:“自动筛选”(适用于简单的条件)和“高级筛选”(适用于复杂的条件)。接下先来介绍“自动筛选”的使用。,首先,将表格中的数据区域选定或者只需确保活动单元格处于数据区域既可(如表2-1所示,活动单元格为B3)。选择“数据”菜单,并选择“自动筛选”命令。如图2-1所示。,图2-1 从“数据”菜单中选择“筛选自动”,这时会在第一行(列标题)出现下拉箭头,用鼠标点击箭头会出现如下结果,如图2-2所示。,图2-2“自动筛选”命令,要筛选出统计学成绩为75分的学生,可选择7
10、5,得到下图2-3的结果:要筛选出英语成绩最高的前三名学生,可在英语成绩下拉箭头选项中选择“前10个”,并在对话框中输入“3”,得到如下图2-4所示结果:,图2-3 统计成绩75分的学生,图2-4英语成绩前三名的学生,要筛选出数学成绩大于80小于90的学生,可在数学成绩下拉箭头的选项中选择“自定义”。在弹出的对话框中,进行相应的设置,如下图2-5所示:,图2-5 数学成绩大于80小于90的学生,下面用“高级筛选”命令筛选出“统计成绩和数学成绩大于80分,或者英语成绩大于90分”的学生。第一步:建立条件区域,即在工作表的顶端插入若干新行来放置条件。具体到本例至少需要插入四行来放置条件(注意:数据
11、区域与条件区域必须有一行间隔)。如下图2-6所示:,图2-6 条件区域的建立,第二步:选择“高级筛选”命令,在弹出的对话框中进行相应的设置。如下图2-7所示:,图2-7“高级筛选”命令的使用,在本例在“数据区域(L)”输入A5:E13,在“条件区域(C)”输入A1:C3,回车确定即可。结果见下表2-2:,表2-2 筛选结果,二、数据排序数据排序是按一定的顺序将数据排列,以便研究者通过排序后数据的特征或趋势,找出解决问题的线索。对于数值型数据的排序,即递增和递减排序,在Excel“数据”菜单中的“排序”命令可以很方便的实现这一功能,由于篇幅所限这里不再介绍。下面介绍如何利用Excel的“排位和百
12、分比排位”分析工具来进行分析,此工具可以产生次序排位和百分比排位。,以表2-3为例,步骤如下:表2-3 8名学生的考试成绩数据单位:分,第一步:在“工具”下拉菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“排位和百分比排位”,回车打开其对话框。,图2-8“排位和百分比排位”命令,图2-9“排位和百分比排位”命令对话框,第二步:(以统计学成绩单列数据为例)对命令对话框进行相应设置。本例统计学成绩数据区域为“B1:B9”,“输入区域(I)”输入“B1:B9”。“分组方式”要求指出输入区域中的数据是按行还是按列排列,在本例中选择默认设置“列”。如果“输入区域(I)”的第一行包含了标志项
13、,则需单击选中“标志位于第一行(L)”复选框,本例显然要选中此项。在输出选项中,按照需要相应选择,本例因输出结果比较多,所以选择“新工作表组(P)”。设置完毕,回车确定,结果见下表2-4。,结果包括四列:第一列“点”为数据原来的排列顺序;后三列依次为数据值、数据值排序和百分比排序。百分比排序的数值指的是“好于多少的”数据,如统计学成绩87分的百分比排序值为85.7%,指的是其成绩好于85.7%的其它数据。,表2-4 排位和百分比排位结果显示,1、筛选出统计学成绩在大于80分且小于90分的学生,将筛选结果另存为“第二次作业-1”的.xls文件;2、筛选出财务会计和统计学成绩均在平均分以上的男生,
14、或者体育成绩在85分(包含85分)以上的女生,将结果另存为“第二次作业-2”的.xls文件;3、排列统计学成绩的数据,显示排位和百分比排位的结果,将结果另存为“第二次作业-3”的.xls文件。,第二次实验作业,一、使用Excel制作定类数据的频数分布例:表3-1是一家市场调查公司为研究不同品牌饮料的市场占有率,调查员某天对50名顾客购买饮料品牌记录的原始数据。具体做法是:如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌记录一次。,实验三:数据的整理与显示,表3-1 顾客购买饮料品牌的记录,本例对各种品牌饮料指定的代码是:1.可口可乐 2.旭日升冰茶 3.百事可乐 4.汇源果汁 5.露露将品牌
15、代码输入到Excel工作表中的B2:B51,这样就将定类数据转化为数值型数据。Excel还要求将每个品牌的代码作为分类标志单独输入到任何一列,这里将代码输入到工作表的C4:C8(见表3-2)。,表3-2 代码输入情况,第一步:在“工具”下拉菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“直方图”,回车打开其对话框(如图3-1,图3-2所示)。,用Excel产生频数分布表和图形的步骤,图3-1 从对话框“分析工具”列表中选择“直方图”,图3-2 对话框的设置,第二步:对命令对话框进行相应设置。本例“输入区域(I)”为B2:B51;“接受区域(B)”为C4:C8,即分类标志的区域。在
16、输出选项中可根据自己的需要确定,本例选择“输出区域(O)”并键入E1(意思是结果从本工作表E1位置开始输出结果)。选择“累积百分率(M)”(若不需要时,此项可不选)和“图表输出(C)”,然后回车确定,结果见表3-3。,表3-3 频数分布结果,将频数分布表中的“接收”用描述性标题“饮料品牌”来代替,将“频率”改为“频数”(输出结果的频率实际上频数),将品牌的代码1,2,3,4,5用相应品牌的名称可口可乐、旭日升冰茶、百事可乐、汇源果汁、露露来代替。并将“其他”行(Excel的一个固定输出形式)去掉,换以相应的“合计”内容,结果见表3-4,表3-4 不同品牌饮料的频数分布,二、数值型数据的分组与图
17、示例:表3-5是某生产车间50名工人日加工零件数(单位:个),采用等距分组的形式制作频数分布表和分布图。,表3-5 生产车间50名工人加工零件数,按Sturges公式来确定组数K:K=1+其中,n为数据的个数,对结果用四舍五入的办法取整即为组数。本例假定根据上述方法分为五组,组距为10:100-110;110-120;120-130;130-140;140-150。,由于Excel不能识别非数值型字符,所以不能把100-110,110-120,120-130,130-140,140-150输入一列作为“接受区域”,程序规定只能把上组限值作为分组标志,即110,120,130,140,150。由
18、于相邻两组的上下组限重叠,为了避免重复,通常采用“上组限不在内”的原则。由于Excel无法识别这一原则,但为了与通常的做法相一致,需要将上组限都减去1,即分组标志变为:109,119,129,139,149,假定已将样本数据和分组标志输入到相应的位置(如表3-6所示),步骤同第三节品质数据的频数分布制作相同,表3-6 生产车间50名工人加工零件数和分组标志单位:个,第一步:在“工具”下拉菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“直方图”,回车打开其对话框。第二步:在“直方图”对话框的“输入区域(I)”输入A1:A51,“接受区域(B)”输入C2:C7,这时还需要单击选定“标
19、志(L)”复选框(请读者自己思考为什么?)。第三步:在输出选项中,本例在“输出区域(O)”中键入D1,同时单击“累积百分率(M)”和“图表输出(C)”复选框。回车确定即可,结果输出见表3-7,表3-7 频数分布输出结果,为了把输出结果转化为易读的形式,应进一步修改表格和修饰图形。如下表3-8所示,把分组标志转换为标准、易懂的形式。,表3-8 日产零件的频数分布,二、多变量数据的显示(雷达图)雷达图具体的做法是:先做一个圆,然后将圆P等分(要绘制P个变量的雷达图),得到P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的
20、距离表示,再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图。下面以2000年我国城乡居民家庭人均各项生活消费支出比重数据为例,绘制雷达图。如表3-9所示。,表3-9 2000年城乡居民家庭人均生活消费支出比重(%),第一步;选中数据所在的区域,本例为A1:C9。单击工具栏上的“图表向导”按钮,或者从“插入”菜单中选择“图表”选项。第二步:在弹出的对话框(图表向导4步骤之1图表类型)中,选择雷达图。如图3-3所示。,图3-3 图表类型,第三步:点击下一步,在弹出的对话框(图表向导4步骤之2数据来源)中,按默认设置(因为在第一步中,我们已经选中数据区域)点击下一步
21、,在弹出的对话框(图表向导4步骤之3图表选项)中进行相应设置。图表选项设置是我们制图过程中的关键步骤,可以在其中加图表标题,设置网格线、图例和数据标志。如图3-4所示(读者可自行体会)。,图3-4 图表选项,第四步:点击下一步,在弹出的对话框(图表向导4步骤之4图表位置)中,点击完成即可。结果如图3-5所示。,图3-5 雷达图输出,使用Excel 的有效性检查防止数据输入中的错误,Excel 提供了一个“有效性”检查的功能,可以在我们输入数据时实时检查录入的数据是否符合要求。如果输入的数据量很小,这种有效性检查并非必要,但如果你要输入成千上万条数据,“有效性”检查可以帮助我们避免许多录入错误。
22、,简单的例子来说明“有效性”检查功能的使用方法,步骤,我们先在Excel 数据表的第一行输入四个变量名:编号,性别,班级,考试成绩。(1)、“编号”的取值我们借助Excel 的自动填充功能来实现:先在单元格A2、A3中输入1,2。用鼠标选中区域A2:A3,把鼠标移至该区域右下角的填充柄(其形状为黑色的小方块),鼠标指针变为一个实心的黑色十字(图2-1)。按住鼠标左键向下拖动至A9 单元格,完成数据的自动填充。,步骤,(2)、对于班级变量,我们用1 表示统计班,2 表示经济班,3 表示金融班,4 表示会计班(同时在另一个工作表中记录这一编码规则,以免日后遗忘)。班级的取值只有1、2、3、4,其他
23、取值都是错误输入,我们可以利用Excel 的“有效性”检查对输入的数据进行限定。,操作步骤,具体操作步骤如下:先选中列B,然后选择菜单栏中的“数据”“有效性”,会弹出图2-2 的对话框。单击“允许”下面的下拉箭头,选择“整数”,再在新的对话框中把最小值设为1,最大值设为4。然后我们在“出错警告”选项卡的错误信息中输入“请输入1-4之间的整数”,这样在输入了1-4 以外的数值时,Excel 会弹出出错信息,并提示“请输入1-4 之间的整数”。,(3)、对于取值非常有限的数据,我们还可以为变量的取值定义一个序列,如果输入的数据不在这个序列中,即为非法输入。下面我们用性别变量(0 表示男性,1 表示
24、女性)加以说明。选中列C,然后选择菜单栏中的“数据”“有效性”,在图2-2 的对话框中选择序列,在“来源”对话框中输入“1,2”(数值用英文状态下的逗号隔开)(图2-3),单击确定按钮。这时,在列C 的单元格中输入数据时,Excel 会提供一个下拉箭头使我们能够从事先确定的序列中选择数值(当然我们也可以直接输入)(图2-4)。在输入大量数据时,使用下拉箭头输入数据会大大影响输入速度。,其他,(4)、对于考试成绩这一变量,我们只要使用“有效性”把数据限定为0-100 之间的整数就可以了。注意数据的有效性检查并不能帮助我们避免其它类型的录入错误:如果你把“60”错输成了“90”,Excel 不会给
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 上机 实验
链接地址:https://www.31ppt.com/p-5757610.html