概率统计的系统认识.ppt
概率统计的系统认识,报告人:赵玮 教授 西安电子科技大学,一、概率统计及其发展历史,目 录,二、教学设计与概率统计知识网络,四、应用案例,三、RV各种分布的关联与分布模式识别 1.自然分布、抽样分布及其几何特征 2RV各种分布的关联及随机模拟生成算法原理 3.了解分布关联的作用 4RV分布模式的识别与拟合,一、概率统计及其发展历史,问题:(1)什么是概率统计?概率与统计有何关联?(2)概率统计有何需求?其历史发展阶段如何区别?(3)概率统计包括哪些内容?它在我国的社会经济与国防建设中起何作用?,一、概率统计及其发展历史,1、概率统计与数学,表1 数学的科学分类表,图1 概率统计的学科分类图,一、概率统计及其发展历史,表2 数学的二级学科内涵与范畴,表3 概率统计(统计数学)的内涵与范畴,一、概率统计及其发展历史,一、概率统计及其发展历史,2、概率统计的内涵及发展历史,图2 统计数学的内涵与边界,一、概率统计及其发展历史,2、概率统计的内涵及发展历史 统计学:“统计”这一名词起源于拉丁文的“Status”,其原意是“情况”,它是随着社会生产的发展和国家管理的需要而产生与发展起来的。早在1000多年前的夏朝,我国就开始了人口、土地等方面的统计,在古埃及(1245年)和罗马帝国(1273年)也有人口调查的记载。统计学就是通过产生、收集、描述、分析、总结和表述这些情况(数据)来达到发现新知识,进而为决策提供支持的一门学科分支。统计学的主要二个分支是分析统计学和应用统计学,其中为从周围环境得来的数据提供数据采集和加工(描述、估计、推断、介释等)的数学方法的分支称为分析统计学,又称数理统计或演绎统计,数理统计的基础是概率论,故概率论和数理统计构成了统计学的数学基础,它们与随后为解决随机动态系统的规划、分析、仿真、评价、决策与控制等逻辑活动提供数学理论与方法支持的各数学分支(随机过程、过程统计、随机运筹学、随机微分方程、随机控制、信息论、统计预测、统计决策等)合起来统称为统计数学;另一统计学的分支应用统计学则是统计学在各学科与专门领域中的应用方法和统计规律的总称,如人口统计学、卫生统计学、地震统计学,地质统计学、气象统计学、生物统计学和电子信息统计学(无线电统计)、军事统计学等。,一、概率统计及其发展历史,2、概率统计的内涵及发展历史 实验设计:在科学研究和工农业生产中,通常需要做一系列实验来考察各 种因素对评价指标(体系)的影响,进而来研究所研究的对象的变 化规律,并通过对规律的研究来达到各种实用目的。因此如何科学 地设计实验方案和实验过程以使较少的实验次数、较短的时间和较 少的成本来达到预期的试验目标,这就是“实验设计”这一学科分 支的研究内容。,一、概率统计及其发展历史,实验设计:试验目标:增加产量,降低能耗,改善产品性能,提高产 品质量水平,获取良好疗效的药品配方,寻求合理的控制手段,摸索科学的工艺条件,提高武器的作战效能实验(试验):有验证性实验、析因性实验、设计性实验、技术训练操作性实验等,实验设计通常对象为析因性实验,而该实验又可分为实物性实验、非实物性实验(如计算机模拟)和混合性实验等。实验方案包括实验组织方式、实验次数、实验水平等因素。实验设计内容:正交试验设计、稳健试验设计、均匀试验设计、干扰控制试验设计、广义试验设计、序贯试验设计、试验设计优化分析、调优运算、统计数据处理等。,一、概率统计及其发展历史,2、概率统计的内涵及发展历史 统计推断:包括参数估计、假设检验、方差分析、回归分析、因子分析、判别分析、协方差分析、聚类分析、主成份分析、多样式分析、时 间序列的分析、预测与滤波、各种随机过程(平稳过程、正态过程、马氏过程、泊松过程、更新过程、威布尔过程)的统计推断等。,一、概率统计及其发展历史,2、概率统计的内涵及发展历史 计算概率论(概率统计计算):该学科分支是概率统计与计算数学的交互内容,它是对概率 统计的相关内容进行数值分析、数据计算及数据处理,进而使各种 随机系统的信息统计处理得以在计算机上实现的一门数学分支。其 内容包括实验数据的统计处理、常用分布函数、数字特征的数值计 算与拟合检验,经验分布与各种曲线的数值逼近与拟合检验,方差 分析、回归分析、多样性分析、主成份分析、判别分析与时间序列 元分析、预测与滤波的数值计算与统计检验,各种随机系统分析的 统计处理,各种统计分布随机数的产生及其统计检验的方法与应 用,后者构成了随机模拟方法(Monte-Carlo法)的主要内容,在各 种随机系统的设计、分析与评价中起着重要的作用。,一、概率统计及其发展历史,2、概率统计的内涵及发展历史 概率论的发展历史:萌芽时期(从远古到1653年):以计数为工具来研究赌博 和占卜中的一些问题及人口统计问题。,一、概率统计及其发展历史,概率论的发展历史:古典概率论时期(16541811年):以代数分析方法、组合方 法为研究工具提出了事件概率的古典定义,主要研究离散型随机变量。代表人物有荷兰数学家 C.Huygens(16291695)对赌博问题作了研 究,于1657年出版了论赌博中的计算,探讨了概率的古典定义、相关原理与概率计算问题,提出了数学期望概念和概率的加法与乘法 定理;法国哲学家、数学家A.DeMoivre,他于1711年在英国哲学学报 1711.(1)(2)(3)中发表了题为“关于游戏中机遇巧合的概率”的论文,并在该论文的基础上于1718年出版了英文著作“机会学说”,在该著作中,他还讨论了大数定律,以二项分布的逼近形式导出了正 态概率密度的数学表达式;T.Bayes于1755年发表了论文“机会学说 中的一个问题的解”,提出了事件的相互独立、互不相容、相互对立 等概念的内涵,从而为事件的关联及运算奠定了基础。,一、概率统计及其发展历史,古典概率论时期(16541811年):在这一时期,随着生产实践的发展,特别是在射击理论、人寿保险、测量误差等工作中提出的一些概率问题,促使人们在概率论的极限定理 方面进行了深入的研究,极限定理的研究工作在十八世纪和十九世纪整 整200年中成为概率论研究的中心课题,其最初的工作主要环绕贝努里试 验概型进行,以后才逐渐推广。此中J.Bernoulli(16541705)于1713 年提出了Bernoulli试验概型,研究了“事件出现频率的稳定性问题”,A.DeMoivre(16671754)和P.S.Laplace(17491827)分别于1718 年和1812年提出了D-L中心极限定理;在此期间的另一重要工作是法国数 学家Buffon(17071788)研究了概率的几何定义问题,并于1760年提 出了著名的“蒲丰投针问题”,运用概率的几何定义计算了“”的数值,P.S.Laplace对英、俄、德、法的男、女婴出生资料进行了广泛调查与分 析,发现各国的男婴出生频率几乎完全一致地稳定在数22/43左右,并发 表于其著作“概率论的哲学探讨”上。,一、概率统计及其发展历史,概率论的发展历史:分析概率时期(18121932):提出了概率的统计定义,并以 特征函数、微分方程、差分方程为工具,主要研究连续性随机变量。主 要代表人物有德国数学家R.Von Mises,他在概率的古典定义的等可能性 的局限性基础上根据事件频率稳定性的实践经验提出了概率的统计定义。P.S.Laplace于1812年出版了著作“分析概率论”,1898年苏联数学家 A.A.Markov用矩方法严格证明了中心极限定理,在此期间还有如下的重 要工作,如S.D.Poisson(17811840年)于1837年提出了Poisson分布,给出了二项分布的Poisson逼近的数学表达式;P.L.Chebyshev(1821 1894)提出了契贝雪夫不等式,并于1845年提出了推广的大数定律;德 C.F.Gauss(17771855年)在P.S.Laplace等人研究的基础上建立了 正态分布律,J.W.Lindeberg于1922年提出了中心极限定理中著名的“林德贝尔格条件”,以该条件为基础的中心极限定理由(美)W.Feller 于1935年进一步得到了完善。,一、概率统计及其发展历史,概率论的发展历史:,一、概率统计及其发展历史,概率论的发展历史:相对于其他数学分支,数理统计是一个较年轻的数学分支,故从其发展来看,一般认为经过二个历史阶段。近代统计学阶段(18世纪末19世纪),(英)T.Bayes(17021761)于1758年出版机会的学说概论,提出了数理统计中的许多专用术语,并沿用至今,他将归纳推理法用于概率论,创立了贝叶斯统计理论,并于1763年发表了这方面的专著,此外他在参数估计、假设检验和统计决策方面也做出了贡献;P.S.Laplace(1749 1827)和C.F.Gauss(17771855)应用贝叶斯方法讨论了参数估计问题。1794年高斯创立了最小二乘法,并于1801年在计算小行星“谷神星”的轨道时应用了最小二乘法,并得到了较精确的计算结果;(比利时)A.Quetelert(17961874)发表了专著概率论书简和社会物理学,主张用研究自然科学的方法来研究社会现象,正式将概率论引入统计学,并最先用大数定律证明了社会生活中随机现象的规律性和提出了误差理论,一、概率统计及其发展历史,概率论的发展历史:,概率论的发展历史:概率统计于20世纪60年代进入我国。早期有影响的学者有许宝騄、严士健、魏宗舒、郑绍廉、侯振廷诸先生,目前被评为中科院院士的概率统计专家有王梓坤、马志明、陈希孺、严加安、陈木法、彭实戈等人。他们在概率论的现代理论、马氏过程、时间序列分析等方面做了大量的研究工作。目前概率统计,特别是数理统计已在我国社会、经济与工程技术领域中的应用已日益广泛与深入。,一、概率统计及其发展历史,一、概率统计及其发展历史,3 几点认识,一、概率统计及其发展历史,表4 概率的四种定义及其相关信息,一、概率统计及其发展历史,表4 概率的四种定义及其相关信息,一、概率统计及其发展历史,表4 概率的四种定义及其相关信息,一、概率统计及其发展历史,表4 概率的四种定义及其相关信息,3 几点认识(2)与其他数学分支学科相比较,概率统计的应用领域十分广泛。概率统计与其他自然科学和社会科学的交叉与渗透,形成了应用统计学的诸多分支,如人口统计学、生物统计学、教育统计学、经济统计学、保险统计学、工业统计学、统计物理、地质统计、地震统计、天文统计、气象统计等。在电子信息领域,也形成了统计无线电理论、统计信号处理、随机信号分析等诸多分支。,一、概率统计及其发展历史,3 几点认识(3)本课程介绍的内容(浙大编),从二级学科概率统计(统计数学)的分类来看,应居于概率统计的基础部份,概率统计的其他部份将会在今后的其他专业基础课和专业课(含研究生课程)上介绍。从概率统计的发展历史来看,本课程介绍的内容应居于“分析概率论”阶段,其分析方法和工具较为初等,适合工科专业学生的数学基础。但由于未涉及“现代概率论”的一些基础知识,故从数理逻辑的角度来看,很多地方存在“漏洞”,故这些内容的构成称为“工程概率统计基础”更为合适。,一、概率统计及其发展历史,一、概率统计及其发展历史,3 几点认识(4)概率统计的相关知识可直接应用于各种随机动态系统(雷达、通信、电子对抗、C3I、城市交通控制、航天器定位与指挥控制等系统)的规划、分析、设计、仿真、决策与控制等研究中,注意到描述各种随机动态系统的数学工具是随机过程和过程统计,而概率统计则是学习随机过程和过程统计的主要基础,也是随机动态过程的静态侧面研究的支持工具。此外,注意到各种随机动态过程的规划、分析、设计、仿真、决策与控制的研究都是在一些特定的计算机平台上实现。由此可知在这些科研项目的研究中采用一系列计算概率论的概念、理论、方法与技术也是十分必要的。,二、教学设计与概率统计知识网络,1.教学设计,图3 教学设计流程图,二、教学设计与概率统计知识网络,2.知识与知识网络 知识:经过人类社会实践所创造的有价值的并表现为信息、数据等形式的 产物,是思想体系、理论体系、工具体系的总和。知识网络:以课程知识点为顶点,以联结知识传递中各知识点的逻辑依 存关系为边的一种有向图。课程(学科)知识网络的生成是课程计划(学科 体系)与教学方案设计的前缀和依据。,二、教学设计与概率统计知识网络,2.知识与知识网络 知识传授的4W范畴:KnowWhat(知道是什么)传授有关事实的知识KnowWhy(知道为什么)传授对事实知识的规律性的认识KnowHow(知道怎么做)传授知识应用于实践的做法(方法、技术、流程等)KnowWho(知道谁掌握)传授知识载体的信息(资料名、作者、期刊等),二、教学设计与概率统计知识网络,2.知识与知识网络 课程需求:(a)为理、工、经、管各专业的后继专业基础课和专业课(包括研究生课程)提供概念、理论基础和应用方法支持(b)为今后从事的各种随机动态系统的规划论证、系统分析、设计、仿真、决策与控制研究提供数学思想和数学方法支持(c)为一些相关学科与考研奠定数学基础,二、教学设计与概率统计知识网络,2.知识与知识网络 后继课程:统计信号处理、随机信号分析、信息网络理论、信息融合与滤波理论、信息论、模式识别、多传感器数据融合、通信原理、雷达原理、电子对抗原理、计算机性能分析、软件可靠性、结构可靠性、器件可靠性、系统可靠性、随机震动系统、统计物理、半导体物理、激光原理、量子光学、计算机控制、系统仿真、计量经济学、雷达系统仿真与性能评估,二、教学设计与概率统计知识网络,2.知识与知识网络 教学目标:概率统计是数学(一级学科)中的一个二级分支学科,它是研究随机现象统计规律性及对这种客观规律性的观察组织和科学估计与判断的一门数学学科,由于该学科理论严谨、应用广泛,从而成为现代社会经济与工程技术人员必须掌握的一门技术工具及我校理、工、经、管各专业的公共基础课。通过该课程的学习,要使学生掌握概率统计的基本概念、必要的基础理论及分析思想和常用的计算方法,从而为后继课程的学习及从事相关科研活动奠定基础。,二、教学设计与概率统计知识网络,2.知识与知识网络 知识传授的评价准则:(a)能较系统地、全面地概括对该知识的认识和思考(b)能系统地反映知识的生成思想、方法和应用层面的内容(c)能完整地刻划与分析知识的内涵与外延(d)能科学地界定知识的应用价值,二、教学设计与概率统计知识网络,3.概率统计的知识网络,图4 概率统计知识网络,二、教学设计与概率统计知识网络,3.概率统计的知识网络 随机过程分类:(a)按概率特性划分(均匀RP、GaussRP、平稳RP、WienRP、M氏RP、PoisRP、鞅RP)(b)按组合结构划分(一维RP、多维RP、条件RP、复合RP、组合RP、集值随机过程)(c)按物理特性划分(周期RP、随机脉冲过程、白噪声过程、散粒噪声过程)随机动态系统:(雷达S、无源侦察S、声纳S、通 信S、随机振动S、城市交通S、计算机网络系统、),二、教学设计与概率统计知识网络,3.概率统计的知识网络系统分析:(信号参数估计、信号的滤波、平滑与预测、信号的统计模式识别、信号的时域/频域分析、过程的统计平衡分析、过程的各态历经分析、系统间的博弈与对抗分析、)系统设计:(滤波器设计、接收机设计、随机服务系统设计、探测(观测)网络结构设计、可靠性结构设计)系统控制:(随机反馈控制、随机线性二次控制),三、RV分布的关联与模式识别,问题:(1)RV分布的产生背景与几何特征有何不同?(2)各种RV分布有何关联?了解这种不同分布的关联有何作用?(3)怎样完成对各种RV分布的模式识别?(4)RV的概率密度曲线其两翼是否均被抑制向下?是否一定具有单峰的几何特征?对于具有多峰特征的概率密度的RV如何进行拟合?,三、RV分布的关联与模式识别,1 自然分布、抽样分布及其几何特征,分布函数的产生背景有如下二类:,(1)自然分布:某些随机变量常用来描述工程、经济、社会或自然界的某种特定现象分布的统计规律性,这样的随机变量对应的分布称为自然分布。,三、RV分布的关联与模式识别,(1)自然分布:分布:分多自然现象如人的身高、体重、农作物的收获量、测量误差、产品的尺寸、炮弹弾着点等的分布常具有两头小、中间大,呈左右对称的特点。故此类R.V的分布称为正态分布(或常态分布),此分布的数学表达式最早(1718年)由法国哲学、数学家A.DeMoivre提出,以后由(德)数学家C.F.Gauss(17771855年)作了系统研究,故又称de Moivre分布或Gauss分布。,三、RV分布的关联与模式识别,(1)自然分布:,三、RV分布的关联与模式识别,(1)自然分布:分布:它常用来描述一系列在给定时间区间内到达某区域的随机质点数的分布规律,如到达某十字路口的汽车数、电话交换台接到的要求通话的呼唤数、纺织机上出现的断点数、到达某区域的放射性粒子数、人类的生育胎数、到达某铁路售票处要求售票的顾客数等的分布规律。历史上Poisson分布是作为二项分布的一种近似,于1837年由法国数学家S.D.Poisson(1781 1840年)引入。近数年来,人们发现该分布在物理学及社会生活中对服务的各种要求等方面有愈来愈多的应用。,三、RV分布的关联与模式识别,1 自然分布、抽样分布及其几何特征(2)抽样分布:,三、RV分布的关联与模式识别,(3)随机变量的取值范畴与分布函数,表5 连续型分布函数(密度函数)的形态与取值范畴分类表,三、RV分布的关联与模式识别,表6 离散型随机变量分布及其取值个数分类表,三、RV分布的关联与模式识别,表6 离散型随机变量分布及其取值个数分类表,三、RV分布的关联与模式识别,:,(3)随机变量的取值范畴与分布函数,三、RV分布的关联与模式识别,:,(3)随机变量的取值范畴与分布函数,三、RV分布的关联与模式识别,2 RV各种分布的关联及随机模拟生成算法原理,图五 分布关联图,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,表7-1 及其常见分布与抽样公式,三、RV分布的关联与模式识别,表7-1 及其常见分布与抽样公式,三、RV分布的关联与模式识别,图六 常见连续型RV随机数抽样公式关联图,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,表8 正态分布与各有关分布的关联关系表,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,:,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,2 RV各种分布的关联及随机模拟生成算法原理,三、RV分布的关联与模式识别,3 了解分布函数关联的作用(1)分布拟合时分布模式的选择(2)作实物试验时的替代观察与统计检验(3)M-C试验时各种分布随机数的生成(4)应用时数学模型的推广(5)概率统计的近似计算与数值逼近(6)理论上的相关探讨,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合,图七 分布模式识别(拟合)流程图,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合 实验设计:(a)确定观察方式(RV直接观察、间接或替代观察、复合观察):(b)抽样方法(物理实验抽样、MC抽样、混合抽样、dB检索)(c)确定样本容量(大样本、小样本)(d)设计或购买观察设备,明确抽样流程,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合 数据处理:异常数据处理,缺少数据弥补,观察数据误差分析 分布选择准则:特殊领域、有前人研究及推荐分布 RV的取值范围 RV经验分布的几何特征,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合 组合分布:,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合 的光滑与修正:,三、RV分布的关联与模式识别,4 RV分布模式识别与拟合 更换拟合分布:(a)可以同一分布函数类中更换(b)可从同一簇分布函数中更换(c)根据概率结构的关联更换,四、应用案例,居民收入统计分析某海域海浪波动过程分析城市交通路口流量分析通信网可靠性分析某侦察系统训练仿真器设计,四、应用案例,案例一:居民收入统计分析1 课题背景2 研究思想,图八 研究思路图,四、应用案例,3 预测原理与模型设计,表九 预测原理与模型表,四、应用案例,3 分布模式的选择与识别,四、应用案例,3 分布模式的选择与识别,四、应用案例,4 参数估计量与分布模式的选择遵循如下准则:,四、应用案例,案例二:海浪波动分析,谢 谢!,