体育统计学课件1-8章.ppt
《体育统计学课件1-8章.ppt》由会员分享,可在线阅读,更多相关《体育统计学课件1-8章.ppt(281页珍藏版)》请在三一办公上搜索。
1、体育统计学,第一章 绪论,第一节 体育统计及其研究对象,统计的作用,客观事物的特征,质的特征,量的特征,统计活动,研,究,统计的分类(从性质上),(一)描述性统计 对事物的特征与状态进行数量描述,身高=226 cm 体重=141 kg,百米速度=15 s 投篮命中率=52%,(二)推断性统计 通过样本数量特征估计推断总体特征,抽,样,总体平均成绩是14.6秒吗,体育统计的概念体育统计是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科。属于方法论学科范畴。理解:1:用普遍的方法研究特殊领域的问题。2:无论描述统计还是推断统计,都服务于对随机现象规律性的研究。,统计
2、工作的基本过程,统计资料的搜集,统计资料的整理,统计资料的分析,统计资料的搜集:(基础环节)根据研究设计的要求获取有关数据资料。统计资料的整理:(中间环节)按照分析的要求对数据资料进行审核和分类。统计资料的分析:(决定性阶段)按照研究目的对整理后的数据进行统计学处理。,统计工作的基本过程,体育统计的研究对象及其特征,研究对象:(1)体育领域里的各种可量化的随机现象。(2)非体育领域里对体育发展有关的各种随机现象。,研究范围逐渐扩大了!,体育统计研究对象的特征,运动性特征:反映运动能力心理能力等方面的数量指标是具有 运动性特征的。(1,与运动有关;2,是动态的)综合性特征:兼有自然科学和社会科学
3、的综合属性。客观性特征:数据来源于客观事物本身,是对客观事物的反映。,第二节 体育统计在体育活动中的作用,是体育教育科研活动的基础有助于训练工作的科学化能帮助研究者制定研究设计能帮助研究者有效地获取文献资料,总体与个体1,总体的概念:根据统计研究的具体研究目的而确定的同质对象的全体。2,个体的概念:组成总体的每个基本单位。3,总体的分类:,第三节 体育统计中的若干基本概念,总体,现存总体,假想总体,有限总体,无限总体,有限总体:基本研究单位的边界是明晰的,并且基本研究单位的数量是有限的总体。无限总体:基本研究单位的数量是无限多个的总体。,样本1,样本的概念:根据研究需要与可能,从总体中抽取的部
4、 分研究对象所形成的子集为样本。2,样本的分类:随机样本和非随机样本,样本,随机样本,非随机样本,采用随机抽样方法获得的样本,研究者根据研究需要,制定某些条件获得的带非随机性质的样本,必然事件和随机事件1,必然事件:在确定的条件范围内,必然发生(或不发生)的事件。(具备可预言性)2,随机事件:在一定的实验条件下,有可能发生,也有可能不发生的事件。(具备不可预言性,只能猜)随机变量1,随机变量:随机事件的数量表现。,随机变量,连续型随机变量,离散型随机变量,至少理论上可以穷举,不能穷举,总体参数和样本统计量1,总体参数:反映总体数量特征的指标。2,样本统计量:反映样本数量特征的指标。概率1,古典
5、概率:适用于总体明晰的情况下。2:统计概率:适用于总体状况不明的情况下。,补充内容:连加和的缩写式,在高等数学中,采用连加求和缩写式形式来表示连加求和数,它的一般形式为:其中:连加求和号 变量(一组观测数据)在 中,i 是下标,n 是上标,i、n 表示连加求和的界限,即从通项公式具体分解的第一项开始相加一直到第n项为止。各具体项根据 i 的取值不同而有所不同,i 取1为第一项,取“n”为第n项。,体育中常用的连加求和运算:,为了避免符号过于复杂,今后凡在求和范围可以看清的条件下,通常将号上下标省略不写,简记为,补充内容:连加和的缩写式,课堂练习:展开连加和缩写式,体育统计学,第二章 统计资料的
6、收集与整理,收集资料的基本要求 1:资料的准确性 2:资料的齐同性 3:资料的随机性 收集资料的基本方法 1:日常积累 2:全面普查 3:专题研究,第一节 统计资料的收集,几种常用的抽样方法,简单随机抽样(完全随机抽样)抽取特点:1:不分组,不分类,不排队地抽取;2:总体中每个个体都有被抽中的机会;3:总体中每个个体被抽中的机会是均等的。抽取方法:1:抽签法 2:随机数表法(见随机数表)该方法的优点:样本代表性好该方法的缺点:总体含量大时,编号困难。工作量大。,几种常用的抽样方法,分层抽样抽取步骤方法:1:按属性特征分成若干类型、部分或层;2:在类型、部分或层中按照比例进行简单随机抽样。分层的
7、需注意的问题:1:层间必须有清晰的界面;(类间差异大,类内差异小)2:必须知道各类型中的个体数目和比例;3:层的数目不宜太多,但也不要极少。分层抽样的优点:1:能够提高样本代表性,又不至于给调查工作带来麻烦,在代表性和工作量之间做出了平衡;2:适用于总体情况复杂、个体数目较多的情况。,分层抽样范例,某大学体育系大一新生总体人数合计900人,田径350人,篮球200人,足球150人,网球100人,体操80人,游泳20人,分,层,田径35人,篮球20人,足球15人,网球10人,体操8人,游泳2人,按照10%比例简单随机抽样,研究样本含量为90人,按照学生专项属性分层,继续下一步的研究过程,几种常用
8、的抽样方法,整群抽样整群抽样的特点:区别于简单随机抽样和分层抽样,抽样的单位不再是总体中的个体,是总体中的划分出来的群。划分群应注意的问题:群间差异要小,群内差异要大。讨论:调查广东省初中毕业生体质达标的情况。如何抽样?,第二节 统计资料的整理,资料的审核1:初审简单排误2:逻辑检查专业知识、常识,指标关系间排误3:复核按比例抽样复核,频数整理频数分布表的制作,频数分布表的编制(实例),【例】某小学五年级学生跳绳成绩如下(单位:个/分钟)。对数据进行分组。,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 12
9、2 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,分组方法,单变量值分组,1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况,单变量值分组表,组距分组,将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,组距分组的步骤(等距分组),求全距(极差)R:R最大值最小值确定组数:组数的确定应以能够显示数据的分布
10、特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K确定组距I:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距(最大值最小值)组数(k)确定组限(组限:是指每组的起点值与终点值),5.根据分组整理成频数分布表 填写组限 按照从上到下、从小到大的顺序填写,只写下限,不写上限 划记 将数据逐个划记到相应的组中,五个为一组 计算:频数(f);频率;组中值(组中值该组下限 组距2),组距分组涉及的几个概念,1.下 限:一个组的最小值2.上 限:一个组的最大值3.组 距:上限与下限之差4.组中值:下限与上限
11、之间的中点值,课堂练习,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,【例】某小学五年级学生跳绳成绩如下(单位:个/分钟)。对数据进行分组。,1.求全距(极差)R:R最大值(Xmax)139最小值(Xmin)107 322.确定组数:3.确定组距:组距(
12、最大值139-最小值107)组数7 5,1+1.70/0.306.6677,4.确定组限:第一组下限(L1)最小值(Xmin)组距(I)/2 107 5/2 104.5105 其他组组限的确定:从第一组开始,每一组的下限加上组距,就得到该组的上限,此上限又是下一组的下限,于是就形成了一列左闭右开的半开区间5.根据分组整理成频数分布表:(略,参照书P17-P18),需要说明的几个问题,关于组数的确定:1:可以依据已有的成熟的专业经验来确定;2:可参考前苏联专家制定的参考表(如右表)确定:关于图形的绘制:可以绘制直观的图形来方便了解数据的信息。较常使用的图形形式有多边形图和直方图等。图形中,一般横
13、坐标代表组限,纵坐标代表频数。,作业,1.每人准备一本固定的作业本。2.教材P19第二章习题第4题,按照步骤与格式制作频数分布表及其直方图。,体育统计学,第三章 样本特征数,第一节 集中位置量数,数据的分布特征及其测量指标,集中趋势(Central tendency),一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的集中趋势指标值适用于高层次的测量数据,反过来,高层次数据的集中趋势指标值并不适用于低层次的测量数据选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定,中位数(Median),中位数,
14、又称中数,中点数。符号Md(Median),定义:是指位于一组数据中较大一半与较小一半中间位置的那个数。,中位数(Median),特征:此数可能是数据中的某一个,也可能根本不是原有的数据。不受极端值的影响计算方法:将数据依大小次序排列,若数据个数为奇数,则取数列中间的那个数为中数;若数据个数为偶数,则取中间两个数的平均数为中数。,概念:样本观测值在频数分布表中频数最多的那一组的组中值。(分组数据的众数,属于引申概念)原始概念:众数,符号Mo,它指在一组数中出现次数最多的那个数。计算方法是直接找到出现次数最多的那个数。众数具有不唯一性。例如:,众数(Mode),无众数原始数据:10 5 9 12
15、 6 8,一个众数原始数据:6 5 9 8 5 5,多于一个众数原始数据:25 28 28 36 42 42,分组数据中众数的计算,频数最多的那一组的组中值。如书P21-P22:练习:找找众数,利用上次所做的作业。,几何平均数,概念:样本观测值的连乘积,并以样本观测值的总数作为次数,开方所得的数据。主要适用于一组数据中有少量数据偏大或偏小,数据分布呈偏态。计算公式:举例说明:1,2,3,4,8,16,42,108见教材P22,例题3.4,算术平均数,算术平均数简称为平均数或均值,符号为M(Mean)总体算术平均数:希腊字母(音:miu)样本算术平均数:英文字母(音:X bar)。算术平均数是由
16、所有数据之和除以数据个数所得的商数,用公式表示为:,算术平均数在应用上有如下特点:算术平均数是一个良好的集中量数,具有反应灵敏、确定严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等优点。算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。,第二节:离中趋势量数,数据分布的另一个重要特征离中趋势的各指标值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值,全距(极差,两极差),概念:一组数据最大值与最小值之差。公式:R最大值(Xma
17、x)最小值(Xmin)特征与缺陷:1:能够了解数据的范围(区域,区间)。2:只考虑极值,容易受到异常数据的影响,属于粗略的指标值,精细程度不够。,绝对差与平均差,绝对差:平均差;,方差和标准差,1:是离散程度的测量指标值之一,最常用。2:能反映数据的分布。3:能反映各变量值与均值的平均差异。4:根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。,总体方差和标准差的计算公式,总体方差的计算公式,总体标准差的计算公式,样本方差和标准差,样本方差的计算公式,样本标准差的计算公式,自由度(degree of freedom),一组数据中可以自由取值的数据的个数当样本数
18、据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,平均数与标准差在体育中的应用,平均数与标准差在决策中的直接应用。变异系数在稳定性研究中的应用。法在原始数据逻辑审核中的应用。,平均数与标准差在决策中的直接应用,例
19、题:教练员要从两名标枪运动员中决定一人参加 比赛,如何作出决策?队员甲:40.50;41.26;40.44;39.62;40.12 42.10;39.84;40.18;38.70;39.54 队员乙:40.48;42.88;40.50;39.50;38.00;43.32;38.72;41.82;36.84;40.24简单应用平局数与标准差进行数据决策的步骤:1:确定样本数据的全域。2:确定样本数据的平均水平。3:确定样本数据的离散程度。4:根据专业专项应用要求采取相应不同决策。注意:决策前提是认同所取得的数据是真实客观有效的。,变异系数在稳定性研究中的应用,例题:某运动员主项为100m跑,兼项
20、为跳远,在竞技期内,其主、兼项目测试结果如下:100m:s s 跳远:m m 试比较该运动员主项、兼项成绩的稳定性。(试比较该运动员100m跑、跳远两成绩的离散程度。)解答:二者的指标单位不同且性质不同,不能够直接进行比较。依据变异系数的概念特征,可以计算CV进行比较:由于该运动员100m跑的CV跳远的CV,故该运动员的100m跑的成绩比跳远成绩稳定。(或说100m跑成绩的离散程度小于跳远成绩),例题:随机抽取某市300名初中男生的身高,经检验基本服从正态分布,并得出 cm,cm,在这300名学生中,有三人的身高原始数据为 cm,cm,cm。试用 法检查这三个数据是否为可疑数据。法进行原始数据
21、逻辑审核的步骤:1:求 的下限和上限。2:数据检验,看数据是否存在 下限,上限 区间之内。3:作出初步判定 a:在区间之内,可以初步认定数据正常;b:在区间之外,需要进一步审核数据的准确性。,法在原始数据逻辑审核中的应用,作业,1.计算教材P19第二章习题第4题中样本数据的所有集中量数指标和离散量数指标。2.教材P39第三章习题第2题。3.自习教材第三章与第四章未讲到的内容。,体育统计学,第五章 正态分布,正态分布的概念与性质,200个样本数据的频率分布直方图,总体密度曲线,无穷多个样本数据的频率分布直方图,正态分布的重要性,1.描述连续型随机变量的最重要的分布2.可用于近似连续型的离散变量的
22、分布3.经典统计推断的基础,概率密度函数,f(x):随机变量 X 的频数:总体方差=3.14159;e=2.71828x=随机变量的取值(-x)=总体均值,正态分布函数的一些性质,概率密度函数在x 的上方,即f(x)0正态曲线的最高点在均值,它也是分布的中位数和众数正态分布是一簇分布,每一特定正态分布通过均值和标准差来区分。决定曲线的位置,称为位置参数;决定曲线的形状,称为形状参数。曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1,即概率值等于1随机变量的概率由曲线下的面积给出,和 对正态曲线的影响,正态分布的概率,标准正态分布,任何一个一
23、般的正态分布,可通过下面的线性变换 转化为标准正态分布,标准正态分布的概率密度函数,标准正态分布,标准正态分布的重要性,一般正态分布的不同取决于均值和标准差 计算概率时,每一个一般正态分布都需要有自己的正态概率分布表,这种表格是无穷多的。若能将一般正态分布转化为标准正态分布,计算概率时就只需查一张表(标准正态分布表)就可以了。,先将一个一般正态分布转换为标准正态分布计算概率时,查标准正态概率分布表对于负的 x,可由(-x)-x得到对于标准正态分布,即X N(0,12),有P(a X b)b aP(|X|a)2 a 1对于一般正态分布,即X N(,2),有,标准正态分布表的使用,标准化的例子A(
24、5,102),x,=5,=10,一般正态分布,6.2,P(5 X 6.2),标准化的例子B(5,102),一般正态分布,P(2.9 X 7.1),正态分布(实例),【例】设UN(0,12),求以下概率值:(1)P(U2);(3)P(-12)=1-P(U 2)=1-0.9973=0.0227(3)P(-1U 3)=P(U 3)-P(U-1)=(3)-(-1)=(3)1-(1)=0.9987-(1-0.8413)=0.8354(4)P(|U|2)=P(-2 U 2)=(2)-(-2)=(2)-1-(2)=2(2)-1=0.9545,正态分布(实例),【例】设XN(5,32),求以下概率值(1)P(
25、X 10);(2)P(2X 10)解:(1),(2),正态分布(实例),【例】设XN(1,4),求P(0X1.6)解:XN(1,4)XN(1,22)故,=1,=2 P(0X1.6),正态分布理论在体育中的应用,主要应用方面:制定考核标准制定离差评价表进行人数估算在综合评价中统一 变量单位,应用正态分布理论制定考核标准,制定考核标准的步骤:1:制作正态曲线的分布草图。2:计算出从 到 ui值所围成的面积概率。3:查表求得各等级的ui值。4:求得各等级标准的原始成绩xi值。举例说明(如书本例5.1),应用正态分布理论制定离差评价表,制定离差评价表的步骤:1:根据指标总数画好框表。2:将各个指标的平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 体育 统计学 课件
链接地址:https://www.31ppt.com/p-5227224.html