管理统计学.ppt
管理统计学,主讲人:北京理工大学 管理与经济学院 李金林 电话:68912482办公室:中心教学楼1012房间E-mail:,教材:,应用统计学 倪加勋等编著 中国人民大学出版社,1995,参考书:,李维铮等,应用统计学,高等教育出版社,1994张洪涛,管理统计学,中国铁道出版社,1994吴世农,管理统计学,江西人民出版社,1994Jonathan D.Gryer,Bobert B.Miller,Statistics for Business,Date Analysis and Modeling-2nd edition Duxbury Press,1994数理统计与管理,中国现场统计学会主办 统计研究,中国统计学会主办 Annals of Statistics Journal of the Ammerican Statistical Association,主要内容(参见教材),第一章 绪论 第二章 统计数据的描述 第三章 概率与概率分布 第四章 参数估计与假设检验 第六章 相关与回归,简要介绍的内容:(自学为主),(第五章)方差分析 5.1,5.2(第七章)时间序列与指数 7.4(第九章)抽样调查对学员的要求:1、掌握基本的统计方法 2、正确运用统计方法解决实际问题 3、运用统计软件求解统计问题 4、认真完成作业,考核方式:,平时作业(5分)+大作业(25分)+课堂考试(70分)说明:不同书中有些概念的解释、定义可能会不同,以讲课中介绍的为准。,第一章 绪论(Preface),近年来,由于某些主要产品及服务的激烈的国际竞争,企业界对统计分析有了新的评价。影响企业竞争力的主要因素是:质量(Quality)、成本(Cost)、计划安排(Scheduling),而这些因素的改进都需要用统计方法去设计和控制。另外,对市场(Marketing)做分析也需要用到统计方法。本课程为MBA学生提供统计思维和统计方法的训练(Training)。统计思维使人们系统地澄清模糊的、不确定的过程,从而改进设计、降低成本。尽管统计学常被人们认为是很抽象、难学的学科,但实际上它是非常现实的学科,希望通过学习大家会体会到它的实用价值。,科学研究的步骤:,观察(observations)假设(hypothesis)推论(deduction)验证(experimental verification),例子:铁锹的学问(泰勒Taylor),观察:注意铁锹的操作假设:有好的方法使操作更有效推论:工作有效性受负荷量影响验证:在不同条件下,用几种大小不同的铁锹,记录工作结果,并进行比较。结论:负荷量是有效性的关键因素,标准的负荷量是21磅,对工厂和工人都受益。统计学主要与观察和验证两步骤有关。,一、统计学在我国的发展,二、对统计学的认识三、统计学的性质四、统计学研究对象的特点五、统计学应用六、统计学分类七、需注意的问题八、计量水准的概念(自学),绪论的主要内容:,一、统计学在我国的发展,第一阶段:1949年-1978年峨嵋会议(解放前我国没有形成统计学学科体系)我国在这阶段的统计学照搬苏联的体系,即社会经济统计学,也称为传统统计学。主要研究:统计指标体系、统计报表、收集数据、统计制度,很少对数据做统计推断。认为统计学是一门独立的社会科学,排斥数理统计学,认为概率、统计、抽样是投机赌博碰运气,冠以资产阶级的统计学。,一、统计学在我国的发展,第二阶段:1978年-现在1.1978年峨嵋会议:两种观点争论激烈 观点1:“数理统计”才是真正的统计学,“社会经济统 计学”是工作经验,不是科学。观点2:“社会经济统计学”才是真正统计学,“数理统计”是数学。2.1996年10月桂林会议,三大学会(中国统计学会,数理统计学会,中国现场统计学会)相聚,提出“大统计学”观点,认为统计学是将上面两者结合,应借鉴世界上普遍采用的体系。并指出要从发展眼光看统计学,它从对象、范围、方法论等方面早已同传统的统计学不同了。,二、对统计学的认识,传统的统计学侧重制度、指标、报表,实际中从事此类工作的人员易被别人替代(百分数)。统计学应是传统统计学与数理统计学的结合(见书中的体系)做为管理人员要学会运用统计方法进行决策,改进工作,提高效率。,美国佛罗里达大学管理统计学课程主要内容:Methods for Describing Sets of DataProbability and Random VariablesSampling DistributionsInferences Based on a Single SampleEstimation Inferences Based on a Single Sample:Tests of HypothesesSimple Linear RegressionMultiple RegressionTime Series:Index Numbers and Descriptive Analyses,三、统计学的性质(什么是统计学?)研究如何收集、整理、分析反映社会经济管理问题的有关数据,并对研究对象进行统计分析、推断的科学。(以期认识事物的规律性),四、统计学对象的特点,1。随机性:发生的结果不确定,不同个体 有差异2。群体性:多个物体(单一物体不需统计)3。数量性:以数量表示事件,五、统计学应用1.气象预报,证券分析,产品寿命估计,抽样检验,保险、库存量估计、市场分析。2.识别、度量风险,企业的风险管理3.精算学:以统计学为基础,与金融学、保险理论结合。确定保费、盈余分配、出险规律。4.新闻调查总之,没有统计分析的管理是不完善的管理。,统计学的应用,审计员检查一个大公司的帐目,可以通过统计方法抽取帐目样本,根据样本结果确定该公司是否有帐目不清的问题。小企业的经理在确定原材料的进货量时。需要考虑可能的原材料需求水平和原材料存储费用。为此他要做相应的调查。经济学家需要根据消费者的购买模式,评价改变销售税对社会的影响。为此他需要通过实地调查,了解主要地区不同收入阶层消费者的购买模式。,统计学的应用,营销经理在决定是否销售一种新产品时,对样本顾客进行试销,并依据评价效果确定可能的销售水平。投资经理依据咨询师的观点并考虑当前政策和企业现状,估计各种投资收益率出现的概率。生产经理根据检验产品样本的质量情况,决定是否对生产过程作出必要的调整。,六、统计学的分类1、描述统计学 数据的搜集、整理、显示和分析2、推断统计学 利用概率论和数据对事物的数量规律性进行估计、检验等推断。由部分推断总体,由现在推断未来。,七、需注意的问题,1.正确选方法 例如:从AB,去时速度20km/h,返回速度30km/h 平均速度=?25km/h?24km/h?2.统计方法要与定性分析相结合,统计方法要与其他学科的知识相结合。例如:电视增加,犯罪增加,是必然?3.防止系统误差 抽样误差(不可避免),系统误差(可避免)例:调查读书欲望,调查交通工具,一、统计数据的收集二、统计数据整理三、集中趋势的测度四、离散程度的测度,第二章 统计数据的描述,1、利用已有资料 出版物政府公报、期刊、专业数据库 教材14页列出了统计出版物2、调查收集(collection through survey)全面调查 非全面调查 重点调查 抽样调查(随机)调查方式:观察、访问、表格(常用)3、调查方案(survey plan)目的;对象;项目;时间;方式;领导;费用;(见教材16页)4、误差 抽样误差(不可避免);系统误差(可避免),一、统计数据的收集(13页),二、统计数据的整理1.总体与样本总体(Population)样本(Sample)涉及的全体元素 总体的部分元素总体容量 样本容量总体中元素个数N 样本中元素个数n总体用X,Y大写 例:身高X,体重Y等样本用x,y.小写 例:x1x2,y1y2,二、统计数据的整理(18页)2、数据分组 按照某种标志,将数据分为几个部分 目的是:快速找出数据的规律性次数分配fi 次数落在第i组的数据个数例如,20页的次数分配表分组的有关问题 a、组数k b、组距取整数(便于计算)c、等距,不等距(调整次数=d、上下限要明确,保证数据不重、不漏,二、统计数据的整理,3累积次数Fi=?例 F1=3 F2=10 F3=23 F4=28 F5=30 f1=3 f2=7 f3=13 f4=5 f5=24频率,累积频率fi/n,Fi/n便于不同容量资料的比较,二、统计数据的整理,直方图 横轴分组标志(histogram)纵轴次数(或频率)(参见21页)通过直方图可了解:a、研究对象的总体规律 b、各分组段的比例 c、数据的分布范围,二、统计数据的整理,条形图(1)进出口增长(见图片80页)(2)人口金字塔(81页)圆饼图(见图片84页)象形图 世界人口变化(见图片85、86页)Lorenz曲线(见教材23页),作业:168个商店投资情况分析 万元 0-1 1-2 2-3 3-5 5-10 10-20 个数 1 17 23 49 61 17不等距情况应保证调整次数后,直方图面积不变。下图是否直方图 6000万元 长话收入(某地区)90 91 92 93 94 95 96,三、集中趋势的测度,1.均值 性质,三、集中趋势的测度,2.几何均值(Geometric mean)适用于环比数据例如:已知各年产值 a0,a1,a2,,a5X1=a1/a0,X2=a2/a1,X3=a3/a2,,X5=a5/a4称为环比数据。求平均增长速度 有关系a5=a0Mg5,三、集中趋势的测度,3.调和均值(Harmonic mean)此公式适用于两类变量的相对变化率数据(例如:速度)4.众数(Mode)出现次数最多的数 5.中位数(Median)排序数据的“中间值”6.四分位数(Quartile)位于 位的数(先排序)(考虑分组数据的以上指标),四、离散程度的测度(32页),1、极差:R=Xmax-Xmin2、方差:(总体容量N)(样本容量n)标准差 S=,四、离散程度的测度,对于分组数据(xI为第i组的组中值)方差另一种表达式(可方便计算),补充作业调查一个村子中200个孩子的牙齿情况A医生:在200人中抽20人,结果如下:蛀牙数 0 1 2 3 4 5 6 7 8 9 10孩子数 8 4 2 2 1 1 0 0 0 1 1B医生:在200人中只记录了没有蛀牙的60名。估计村子里孩子总的蛀牙数:(1)用A的结果(420)(2)用A,B的两种调查结果(490),第三章 概率及其分布(43页)(Probability and its distribution),一、随机事件与概率二、概率运算公式三、随机变量及其分布四、常用分布(61页)(此章内容为复习性质),现实中的一些应用问题需用到概率与统计的方法,例如:预防性更换问题(寿命)产品保换期的确定(寿命)库存水平的确定(需求)(还有很多例子),一、随机事件与概率,1、随机事件:可能发生也可能不发生的结果。基本事件是不可再分的随机事件。(基本事件也称为样本点)2、样本空间:样本点的全体 例:掷一个骰子:(等可能)掷两个骰子:(不等可能),一、随机事件与概率,3、事件的概率古典概率:P(A)=m/n(样本点有限个,样本点等可能发生)“统计”概率:m/n(n次试验中,A出现m次)P(A)=m/n主观概率:由经验确定的公理化概率:(满足下列条件)a、对事件A有 0P(A)1b、P(S)=1 c、Ai互斥(i=1,2,n),则P(Ai)=P(Ai),二、概率运算公式(1/2),1、加法 P(A+B)=P(A)+P(B)-P(AB)2、乘法P(AB)=P(A)P(B|A)3、独立性 P(AB)=P(A)P(B)4、全概率公式P(B)=P(A)P(B|A)+P()P(B|)5、贝叶斯公式P(Ai|B)=P(Ai)先验概率 P(Ai|B)后验概率(在掌握信息后对P(Ai)调整),二、概率运算公式,例如:已知,在严格控制下次品率为0.05,在不严格控制下次品率为0.20又根据历史情况知道:90%的工作时间为严格控制 P(C)10%的工作时间为不严格控制 P(C)现从工作现场抽取一件产品为次品。P(C|D)=0.690.9=P(C)(称P(C)为先验概率)根据抽样为次品的情况,我们直觉上也倾向于严格控制的比例在减少。D-次品(称P(C|D)为后验概率),三、随机变量及其分布(random variable and its distribution),r.v.随机变量是用变量表示事件1.r.v.特点 取值随机,取值的概率是确定的 r.v.分为连续、离散 习惯用X,Y.大写字母表示,三、随机变量及其分布,2、r.v.的分布(1)离散r.v.分布(discrete)X x1 x2.Xn Pi P1 P2 Pn(n可以是,Pi0)也可写成P(X=xI)=表达式的形式例如:=(掷骰子?),三、随机变量及其分布,(2)连续r.v.X的分布(continuous)分布函数F(x)=P(Xx)也可描述离散r.v.OF(x)1,F(x)F()=?,F(-)=?分布密度函数f(x)f(x)0,F(x)=1 F(x)=f(x),三、随机变量及其分布,密度f(x)几何意义X连续r.v.,则P(X=a)=0。故此时F(x)=P(Xa)=1-F(a)P(aXb)=F(b)-F(a)例:下面哪些式子是不可能的?P(X=6)=0.8 P(X=10)=1.3 F(3.2)=1.6 f(1.5)=0.8 F1(3)=0.5 F1(4)=0.4 f2(3)=1.6 f1(4)=1.0,四、常用分布(61页),(1)离散r.v的分布两点分布 X 0 1形式:pI 1-p p 常记q=1-p背景:产品检验(合格取1,不合格取0)打靶(中靶取1,不中靶取0)期望:E(X)=p 方差:D(X)=pq,四、常用分布(61页),超几何分布形式:P(X=k)=,K=0,1,min(n,M)背景:产品检验。从N个产品中取n个检验,(其中有M个合格品)求n中有k个合格品的概率。(即X合格品个数)不放回!期望:E(X)=nM/N=np方差:D(X)=npq,四、常用分布(62页),二项分布形式:P(X=k)见书背景:在n次独立重复试验中,“A发生K次”的概率。(P为在一次试验中A发生的概率)有放回的试验!期望:E(X)=np 方差:D(X)=npq,四、常用分布(62页),泊松分布形式:P(X=k)见书,k=0,1,.n,背景:单位时间内,电话交换台接到的呼叫次数X单位面积上,疵点个数X 期望=方差:E(X)=D(X)=,四、常用分布,例:62页例3.11例:某单位每天用水正常的概率3/4,求“近六天 内有四天用水正常”的概率。(每天用水独立)例:20部机器独立工作。已知1小时内每部机器故障概率0.01。求:“1小时内20部机器中有2部故障”的概率。若有2人看此20部机器,求“至少1人空闲”的概率?,四、常用分布(62页),例:72页习题6关于超几何、二项、Poisson分布的近似关系:(1)当N大,n小(n/N0.1)时,可用二项分布近似超几何分布(此时令P=M/N)(2)当n大,p小时,可用Poisson分布近似二项分布(取=np)。(n100,p0.01 np=1,一般0.1np10即可),四、常用分布(62页),(2)连续r.v的分布正态分布形式:F(x)=f(x)=背景:见63页(1)实际应用,(2)理论近似期望:E(X)=u方差:D(X)=2 记为N(u,2),四、常用分布(63页),正态分布密度函数的特点对称的钟形3=P(|X-|3)=0.9973标准正态分布,记为N(0,1)可查表知(x)的值(430页)标准化方法:F(x)=()例:(1)=?(1.1)=?(1.11)=?P(X+)=F(+)=(1)=P(-3X+3)=F(+3)-F(-3)=(3)-(-3),四、常用分布,例题:见65页例3.12例题:预防性更换 确定更换时间t0使产品在t0时可靠度为0.90(t0称为可靠寿命)解:设X寿命服从正态分布N(20,32)例题:见65页例3.12例题:确定产品的保用年限 见73页习题9,四、常用分布(66页),指数分布形式:F(x)=1-e-x,x0 f(x)=1-e-x,x0背景:电子产品的寿命、服务时间、顾客到 达间隔时间一般服从指数分布。期望:E(X)=1/方差:D(X)=1/2,四、常用分布(66页),均匀分布形式:F(x)=0 xa axb 1 xb f(x)=1/b-a axb其它背景:特定情况下期望:E(X)=(a+b)/2方差:D(X)=(b-a)2/12,概率的应用,例:某汽车加油站每周补充一次汽油。现在要确定此加油站储油库的最少容油体积,使得在一周内加油站的油售完的概率不大于0.01。要解决此问题,应考虑哪些因素,应如何收集数据,应采用什么统计方法,建立什么概率模型?,对问题的讨论(确定储油量的例子)1、要明确随机变量X。显然X为“加油站每周的售油量(单位:KL)”,此为连续型随机变量。2、要确定X服从的分布函数F(x)或分布密度f(x)。若F(x)或f(x)未知,则应收集加油站每周的售油量的历史数据x1,x2,xn,绘制直方图,以此粗略判断分布类型。然后,用统计方法进行拟合优度检验。最后确定分布形式F(x)或f(x)。,(接上页)3、若F(x)或f(x)已知,设f(x)=C(1-x)3 0t0)=即(1-t0)40.001,t01-=0.6838(KL)因此,储油库容油体积至少为684L才能保证在一周内售完油的概率不大于0.001。,概率的应用,例:某药品反应率为0.0001。现有2万人使用此药。求这2万人中发生过敏反应的人数不超过3人的概率。解:X2万人中发生过敏反应的人数P(X3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)用什么分布?,例:产品合格标准。若使产品(布)的合格率达98%,则单位面积的疵点数最多定为多少为合格标准x0?解:X单位面积上的疵点数(已知=3)P(Xx0)=0.98=9/2 27/6 81/2481*5/24*5 1.012519.68(i=7),概率的应用,例:在前面“预防性更换”的题目中,若寿命X服从指数分布,情况会如何?例:门的高度确定?例:60岁健康人,5年内死亡的概率为P,保险公司办理5年保险交a元。死亡则赔b元。a=?b=?使公司获利。X a a-b解:P 1-P P a-bP0 aba/P,例:无人售票的可行性?例:一项工程项目能否在26天(规定时间内)完成?(已知施工完成时间X?)上面例题中涉及到的参数,均需由实际调查、试验数据确定。需依靠统计方法解决。一般密度函数f(x)与直方图相对应。,第四章 参数估计与假设检验,一、抽样的基本概念二、抽样分布三、参数估计,一、抽样的基本概念(Sampling),1、样本的两重性(总体X)抽样前样本看成随机变量 X1,X2 Xn抽样后样本看成观察值 x1,x2 xn2、简单随机样本 X1,Xn与总体X有同分布 X1,Xn相互独立(independent identity distributions:iid)3、样本统计量样本的函数(,S2等),也有两重性。统计量服从的分布抽样分布,二、抽样分布,抽样分布一般较复杂,但对于正态总体较简单。1.X1.Xn iid 于N(,2),则XN(,)(在大样本时,(n30),可不做总体的正态假设)2.2分布(见76页)(不对称分布)X1.Xn iid N(0,1),则2=Xi2 2(n)其中n自由度 df(degree of freedom)一般求2:P(2(n)2)=,(查表433页)例:=0.05,n=10 20.05(10)=18.307,二、抽样分布 Sampling distribution,3.t分布(见77页)(是对称分布 symmetrical distributiom n30时,近似正态分布)有自由度要求经常求:t/2 双侧百分位数:P(T t/2)=t 单侧百分位数:P(Tt)=(查表434页)例:=0.1 t/2(21)=1.721,t(21)=1.323,三、参数估计,(用样本对分布中的参数加以推断)1、点估计代替法:用频率代替概率 用样本特征代替总体特征值(总体特征包括:均值、方差等)注意:用此法时,需知道总体特征与参数的关系 样本均值 样本方差,三、参数估计,例如:XN(,2),则(表示参数的点估计值,其他参数同样解释)例如:X指数分布F(x)=1-e-x,均值为1/则 例如:Xa,b上均匀分布,则=,由这两个式子求出,三、参数估计,2、估计量的标准 无偏性 E()=例如:、中位数都是均值参数()的无偏估计。S2是方差参数(2)的无偏估计。有效性:参数的两个无偏估计1,2,若E(1-)2E(2-)2,则称1比2有效。例如,比中位数有效。为均值参数的“最小方差无偏估计”。,三、参数估计,3.区间估计思想:确定一个区间,保证以很大概率使参数落入该区间中。(此区间一般应包含参数的点估计)例:设x1,x2,xn是来自于总体N(,32)的 样本,试确定区间,使其有95%把握包含参数。,三、参数估计,解:已知 服从N(0,1)。由于可查正态分布表得出因此,有其中 称为置信度,包含的区间,称为置信区间。,均值 的区间估计,设 X1.Xn iid 于N(,2),为的点估计,求置信度为 1-的 的置信区间。已知时:由于 z=服从N(0,1),得到置信区间 说明:对于非正态总体,当 n 50 时,仍可用 z 统计量进行区间估计,并用 S 代替(见89页例4.5)。,总体均值 的区间估计,未知时:未知时(小样本)已知 t=服从 t(n-1)分布,得置信区间 例题见90页(例4.6)一般对称区间时,置信区间最短。,推荐网站:北京大学中国经济研究中心双学位讲义中的商务与经济统计。网址:http:/,样本容量的确定在正态总体下(非正态不易处理)均值区间估计时的样本容量n的确定方法若规定区间宽度为2(为 偏差,允许误差)则有问题:当区间减少一半时,n增加多少?,在点估计中用无偏性、有效性(方差大小)衡量估计量的优劣。在区间估计中用置信度、样本容量及区间宽度衡量优劣。有关系:n不变,1-增大,则 增大,即宽度增大,精度下降。所以追求置信度高,则影响精度。1-不变,n增大,则宽度减小,精度上升。但是,如果n太大,会造成浪费,失去抽样意义,因此,精度的选取要适当。,例:5000人中抽100人,计算出 平均月 收入800 元。求这5000人中平均月收入范围(取=0.99,=10)最大偏差是多少?不变,使减少,n为多少?不变,使=0.95,n为多少?,1-,1-,1-,=2.576,=2.576 3,=2.576 n=225 n=57.89,背景:随机抽取的n个产品中有k件次品,则次品率的点估计为 现有结论:近似地有:得p的置信区间为:例题见 91页例4.7,两总体均值差的区间估计(见92页,此部分自学)正态总体方差 的区间估计 设 iid N(,2),S2为2的点估计,求置信度1-的置信区间。已知 查表求,得 的置信区间:例题 97页例4.10(没有在教材后的表中,可在其他书中找),两个正态总体方差比的区间估计()从 两个总体中独立各取样本,样本方差分别为,现对 做区间估计。,已知,得到:,此区间估计常用来比较方差大小,当上限1,下限1时,不能做比较,需用其他方法。例题:见97页例4.11参数区间估计小结表见99页100页。查,,四、假设检验(Testing Hypothesis)统计推断的又一类问题,对问题得出“是”与“否”的结论。背景:改进加工工艺后,产品的平均尺寸是 否显著变化?(原尺寸 改进 工艺后,取10件测量,)改进工艺后,生产是否稳定?(是 否显著变化?合格率是否符合规定?产品寿命是否符合正态分布?,对以上问题,可分别假设:没有显著变化,:稳定,:符合规定:服从正态然后根据样本,判定 是否正确,若正确,接受,否则拒绝。这就是假设检验的内容。一般把要检验的假设称为原假设(零假设),与原假设相反的假设称为备择假设。,理论依据:“小概率原理”小概率事件在一次试验中几乎不发生。1.假设检验的思想:举例:已知在总体 时,若 成立,即 则应有(即以很大概率出现,相反的不等式对应的事件以小概率出现),现经抽样,计算若,则没有矛盾。若,说明“小概率”事件在一次试验中出现了。这是与小概率原理矛盾的,说明 错了。2.假设检验的步骤:a.建立原假设(及备择假设)b.确定显著性水平表明:当零假设正确时,拒绝 的概率 是 弃真错误,c.选择统计量(例如:,d.计算统计量的值,与临界值做比较 若超出临界值,则拒绝 若小于临界值,则接受 若等于临界值,则加大样本容量。,3.检验的内容(104-111页)总体均值的假设检验,(已知数)已知时,用z统计量 未知时,用t统计量(用s代替)(例题见104页,例4.13)大样本时(),不论总体为何种分布,均可用z统计量近似。,两正态总体均值是否相等的检验,已知时,用z统计量 未知时,用t统计量(且要求 可用 代替)。大样本时(),不论总体为何种分 布,均可用z统计量分析。(例题,105页例4.14),总体方差的假设检验统计量,查表,得若,则接受原假设;若反之,则拒绝原假设。例题,见106页,例4.15,其他检验内容略。汇总表(Hypothesis Testing),见108-111页。作业:112-115页 4、5、6、8、10(1)(2)、12、13、14,4.假设检验的例子1993,1994年上证所商业类上市公司净资产收益率之间是否有显著性差异?解:设收益率,,东北华联,新世界,第一食品,济南百货,12.35,7.9,1994年(2),1993年(1),6.16,11.00,1.23,7.75,13.96,5.6,方法1:处理数据:-4.45,-8.36,6.52,4.84(n=4)(没差异),统计量 计算经比较,故没显著差异。,方法2:直接用105页的公式。但前提是 两总体方差相等。此题中对是否 两总体方差相等是不清楚的,故 不宜使用此公式。若可证明两总 体方差相等,则可用此方法。关于两总体方差相等的检验见(106-107页)。说明:此例子用方法1处理的前提是两个样本容量相同。,解释计算结果:93-94年,上证所上市类公司净资产收 益率之间没有显著差异。将没差异判断为有差异的可能性是5%。此例摘自数理统计与管理杂志97年第4期。补充作业:两校新生学习(高等数学)成绩 是否有差异?(成绩服从正态分布),甲校,乙校,11名,11名,5.两类错误 不变多少,在拒绝 时,均会有失误(随机因素造成的),称之为弃真错误,也称为第一类错误、供货方风险。还有一类取伪错误,也称为第二类错误、使用方风险。一般控制 情况较多,本课中不讨论 的计算问题。,两类错误 的示意图(与 不可能同时减小),6.点估计、区间估计、假设检验的用途 主要用于确定分布函数中 的参数。主要用于估计指标的范围(例如城市人口、平均消费量等),还可用于确定样本容量。主要用于同以往情况的比 较,用于不同总体的比较,两者差异 的判断。,例如,公安系统破案时,对现场的脚印、步幅等同嫌疑人做比较。7.单侧假设检验(略),第六章 回归分析一、变量之间的关系a.函数关系 XY,例如y=lnx(一一对应)b.相关关系(统计关系)x与y有依存,但y不是由x唯一确定的。(有对应,但不唯一确定)例:价格需求量 气温冷饮、空调需求量,回归分析:根据观测数据,对具有统计关系的变量建立回归模型,并进行统计推断。解决以下问题:确定变量间是否有统计关系(相关关系),若有,找出表达式;根据一个或一组变量的值,预测另一个变量的值。,回归模型的种类,非线性,线性,单变量,多变量,二、一元线性回归(Simple Linear Regression)例:X价格,Y产品需求量,测得数据:,。,1.散点图(Scatter plot)由图设想用 近似表示X、Y的相关关系。y与 有差别。2.回归方程,