统计学第六版贾俊平第1章ppt课件.ppt
统计学,第 1 章 导论,1.1 什么是统计学?1.2 统计数据的类型1.3 统计中的几个基本概念,学习目标,1. 理解统计学的含义2.理解统计数据与统计学的关系3.了解统计学的应用领域4.了解数据的类型5. 理解统计中的几个基本概念,1.1 什么是统计学?,统计学与统计规律统计的应用领域历史上著名的统计学家,什么是统计学?,1. 数据搜集:取得数据2. 数据分析:分析数据 3. 数据表述:图表展示数据数据解释:结果的说明, 收集、分析、表述和解释数据的科学,statistics的定义(不列颠百科全书),statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列颠百科全书),统计研究的过程,实际问题,统计规律(一些例子),正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系,统计方法,描述统计(descriptive statistics),内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律,推断统计 (inferential statistics),内容参数估计假设检验目的对总体特征作出推断,描述统计与推断统计的关系,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),统计的应用领域,统计的应用领域,actuarial work (精算) agriculture (农业)animal science (动物学) anthropology (人类学)archaeology (考古学) auditing (审计学)crystallography (晶体学) demography (人口统计学)dentistry (牙医学) ecology (生态学)econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划)engineering (工程) epidemiology (流行病学)finance (金融)fisheries research (水产渔业研究)gambling (赌博) genetics (遗传学)geography (地理学) geology (地质学)historical research (历史研究) human genetics (人类遗传学),统计的应用领域,hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学)manpower planning (劳动力计划)management science (管理科学)marketing (市场营销学) medical diagnosis (医学诊断)meteorology (气象学) military science (军事科学)nuclear material safeguards (核材料安全管理)ophthalmology (眼科学) pharmaceutics (制药学)physics (物理学) political science (政治学)psychology (心理学) psychophysics (心理物理学)quality control (质量控制) religious studies (宗教研究)sociology (社会学) survey sampling (调查抽样)taxonomy (分类学) weather modification (气象改善),历史上著名的统计学家,Jacob Bernoulli (伯努利)(1654-1705) Edmond Halley (哈雷) (1656-1742) De Moivre (棣美佛) (1667-1754) Thomas Bayes (贝叶斯) (1702-1761)Leonhard Euler (欧拉) (1707-1783)Pierre Simon Laplace (拉普拉斯) (1749-1827)Adrien Marie Legendre (勒让德) (1752-1833) Thomas Robert Malthus (马尔萨斯) (1766-1834),Thomas Robert Malthus (马尔萨斯),Pierre Simon Laplace (拉普拉斯),Leonhard Euler (欧拉),历史上著名的统计学家,Friedrich Gauss (高斯) (1777-1855) Johann Gregor Mendel (孟德尔) (1822-1884)Karl Pearson (皮尔森) (1857-1936)Ronald Aylmer Fisher (费歇) (1890-1962), Jerzy Neyman (1894-1981) Egon Sharpe Pearson (皮尔森) (1895-1980)William Feller (费勒)(1906-1970).,Friedrich Gauss (高斯),Johann Gregor Mendel (孟德尔),分类数据、顺序数据、数值型数据观测数据和实验数据截面数据和时间序列数据,1.2 统计数据的类型,什么是统计数据?(data),对现象进行计量的结果 不是指单个的数字,而是由多个数据构成的数据集 不仅仅是指数字,它可以是数字的,也可以是文字的,统计数据的分类,统计数据的分类,统计数据的分类 (按计量尺度分),分类数据(categorical data) 对事物进行分类的结果数据表现为类别,用文字来表述例如,人口按性别分为男、女两类 顺序数据(rank data) 对事物类别顺序的测度数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 对事物的精确测度结果表现为具体的数值例如:身高为175cm、168cm、183cm,统计数据的分类(按收集方法分),观测的数据(observational data) 通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据试验的数据(experimental data) 在试验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据,统计数据的分类(按时间状况分),截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据时间序列数据(time series data) 在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据,1.3 统计中的几个基本概念,总体和样本参数和统计量变量,总体和样本,总体(population)所研究的全部元素的集合 ,其中的每一个元素称为个体 分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本 (sample)从总体中抽取的一部分元素的集合构成样本的元素的数目称为样本容量,参数和统计量,参数(parameter)研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示 统计量(statistic)根据样本数据计算出来的一个量 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示,变 量(Variable),说明现象某种特征的概念如商品销售额、受教育程度、产品的质量等级等变量的具体表现称为变量值,即数据变量可以分为分类变量(categorical variable) :说明事物类别的一个名称顺序变量(rank variable ) :说明事物有序类别的一个名称数值型变量(metric variable ) :说明事物数字特征的一个名称 离散变量:取有限个值 连续变量:可以取无穷多个值,统计中的几个基本概念,几种常用的统计软件(Software),典型的统计软件SASSPSSMINITABSTATISTICAExcel,本章小节,1.统计学与统计规律统计的应用领域统计数据的类型统计中的几个基本概念,