数理统计在化学中应用.ppt
《数理统计在化学中应用.ppt》由会员分享,可在线阅读,更多相关《数理统计在化学中应用.ppt(85页珍藏版)》请在三一办公上搜索。
1、数理统计在化学中的应用,数理统计方法在化学中的应用,李振华复旦大学化学系表面化学实验室,讲义,绪论,统计方法是一种用于收集、表示、分析和解释通过观察和实验而得到的基本数据的方法,是人类认识自然和社会的重要手段。上海股票市场收益率分布模型统计研究在运用正态分布假设的GARCH模型来描述金融收益序列的条件分布时,正态分布假设常常被拒绝,人们用一些具有尖峰、厚尾特性的分布,如t分布、GED分 布来替代正态分布假设,从而得到一系列GARCH模型的扩展形式,如GARCH-t模型、GARCH-GED模型等。本文依据严密的统计分析方法选择了 GARCH-t(1,1)模型描述上证综指对数收益率序列的分布。最后
2、,根据各项模型检验结果说明,用GARCH-t(1,1)模型描述上证综指收益率序 列是有充分理由的。统计定价模型与股票投资决策2007年 第15期,作者:高祥宝,闫惠敏,数理统计在化学中的应用,3,韩寒代笔之争,首先从逻辑角度讲,方舟子应该证明 P(A|F)大于一个很大的值如95%。这里 A是方的假设,比如“三重门是韩父写的”F是所有可观测的客观事实的集合。这里方可以用两种方法去证明P(A|F)95%.第一种是找到一些列的独立证据F1,F2,F3每一个证据 P(A|Fi)都很大,比如他能找到证人证明什么时间,什么地点由什么证人看到了听说了韩父代写,或者手稿上的字迹能证明是韩父的。这些都是硬的证据
3、,方没有。这没有关系,方可以采用另外一种方法证明,那就是对于某一个事实Fk,如果 P(Fk|a)很小,这里a是A的补集。(也就是a=”三重门是韩寒自己写的“)那么通过贝耶斯公式反推P(A|F),如果P(Fk|a)足够小,那么P(A|F)是可以大于95%的。这种也是方一直在采用的方法,但使用这种方法的问题在于,根据公式,P(A|F)=P(AF)/P(F)=(P(F1|A)*P(F2|A)*P(Fn|A)*P(A)/(P(F1|A)*P(F2|A)*P(Fn|A)*P(A)+(P(F1|a)*P(F2|a)*P(Fn|a)*P(a)也就是说,如果F由很多n个独立的事实组成,那么,你如果只找到了个很
4、小的P(Fk|a)是不能推断P(A|F)很大的。也就是说,如果这里有100万个事实,你找到了100个 令人质疑的事实 根本没用,除非你的那些令人质疑的事实的概率极其小。这也就是我们金融领域常说的data mining.也就是,在同一个sample里不停的用各种方法去找股票的规律,最后你总能找到“一些”的规律,比如,“每个月的第一天股价总是上升的”之类的。你用统计方法做假设检验,t-value都好高,但是没用,因为你是先看到了Sample再做的检验。同理,方舟子把韩寒的资料不停的翻,不停的找,总能找出点什么异常的,但是这根本无法证明什么。除非方舟子可以做 out of sampletest.比如
5、,方舟子用他的假设来推断一些事实存在于他还没看过的/不知道的韩寒的书,资料,或者事件,那才能算得上证据。不然的话,今天证明这个,明天证明那个,不过就是一个data mining 的游戏而已。,韩寒代笔之争,【例四】假设有一个要证明韩寒作品有代笔的实验。零假设:韩寒作品没有代笔 备择假设:韩寒作品有代笔 选择显著性水平=?(且预设检验力1-=?)选择样本、收集数据,计算p值。若p,则无法拒绝零假设。,红楼梦前80回与后40回作者之争,早在 1980 年,在美国威斯康星大学召开的“首届国际红楼梦研讨会”上,该校华裔学者陈炳藻教授首次报告了他在这方面的研究工作(见 4,5),此后还出版了专著(见 6
6、)。陈教授将红楼梦 120 回分为三组,每组 40 回,并将儿女英雄传作为对照组进行比较研究。他从每组中任取 8 万字,挑出名词、动词、形容词、副词、虚词这 5 种词,然后运用统计学方法算出各组之间用词的相关程度,结果发现:红楼梦前 80 回与后 40 回所用词汇的相关程度远远超过红楼梦与儿女英雄传所用词汇的相关程度,并由此推断:前 80 回与后 40 回均为曹雪芹一人所作。,红楼梦前80回与后40回作者之争,但是,我国华东师范大学陈大康教授得出了迥异的结论(1987,7)。他也把红楼梦 120 回分成三组,每组 40 回,并统计了其中所含词、字、句等 88 个项目。他发现,这些词在前两组出现
7、的规律相同,而与后 40 回却不一致;关于用字特点和句式规律,前两组也是惊人的吻合,而后 40 回则迥异。由此推断:后 40 回非曹雪芹所作(但含有少量残稿)本文以数据分析为基础,以统计学中“两个独立二项总体的等价性检验”为基本方法,很清楚明确地证明:红楼梦前 80 回与后 40 回在饮食与花卉的描写上确实存在非常显著的差异;在树木的描写上也存在明显差异。不过,这种差异还不能说明红楼梦前 80 回与后 40 回出自不同的作者。,数理统计在化学中的应用,统计学是“对令人困惑费解的问题做出数字设想的艺术。”-美国David Freedman统计学是一门处理数据中变异性的科学和艺术。-John M.
8、LastA Dictionary of Epidemiology 科学与艺术的不同在于不同的人处理相同的问题可能得到不同的结果,数理统计在化学中的应用,实验化学的基础是测量,实验化学学科作为一门实验科学,一直被认为是有着很大欠缺的,那就是欠缺严格性、逻辑性以及精确性的理论。测量具有随机可变性、不确定性、模糊性。统计学可解决前两种问题.,数理统计在化学中的应用,测量的重要性,在美国芝加哥大学社会科学研究馆的正面,刻有这样一段铭文:“假若你不能测量,你的知识就是贫乏和不能令人满意的。”实际上,这句话还应该这样来补充:“假如你只懂得测量,那么你对世界的认识将是可怜的。”,数理统计在化学中的应用,不能
9、片面强调测量的精确性,长期以来,我们已习惯于把科学知识看成是许多确实无误的陈述的集合,化学中同样也是这样,充斥着决定论。片面地追求所谓精确性,其结果只能是将认识过程中的某一部分加以近似化、简单化,最终常会走向形而上学,乃至神秘主义。,数理统计在化学中的应用,二.统计学的历史及作用,统计学的历史一般认为开始于十七世纪中叶,最初的统计学出现在德国和英国,被称为古典统计学。统计学的发展史上曾形成过记述学派、政治算术学派、数理学派这三个主要学派。十九世纪中叶,数理学派的代表人物比利时科学家凯特勒(L.A.J.Quetelet)将概率论正式引进到统计学中之后,也就开始了数理统计学的发展时期。,数理统计在
10、化学中的应用,数理统计在科学研究中得到了极其广泛的应用,主要地是由于以下几个原因:窥一斑而知全豹:科学实验的研究对象具体地只能是极小一部分样品,研究的最后结果也只能是从这一小部分样品的研究结果出发来作出统计推断,也就是运用数理统计方法推断出研究对象的全体来。归纳规律:科学实验中不可避免地会存在着大量随机误差的问题,要从这些随机现象中去得出准确可靠的研究结果,这只能依赖于数理统计的方法和原理。优化和试验设计:科学实验经常要进行各种条件试验,诸如合成路线、配方设计、工艺条件、寿命试验等等,这就需要运用统计的原理和方法来进行优化和实验设计。,数理统计在化学中的应用,数理统计在科学研究中得到了极其广泛
11、的应用,函数关系:科学实验中总要研究各个变量之间的关系,并进而进行科学的预测和推断,而这些是离不开数理统计方法的应用的。数据处理:随着现代科学研究的发展,各种测量仪器的计算机化给我们带来了“数据爆炸”,如何来处理这些大量的数据,并要能从这些数据中获取更多的甚至意想不到的信息,只有数学和统计学技术才能给我们以可靠的保证。,数理统计在化学中的应用,三.统计方法在化学中应用的意义,应该说化学这一学科基本上还是一门实验学科,因此化学工作者掌握数理统计的原理及其应用的必要性和实际意义也就显得尤为重要。只有正确地运用数理统计方法,才能够帮助我们在化学实验中,从表面杂乱无章的现象里去寻找出有意义的统计结论来
12、;才能使我们能更有成效地进行各门化学领域中的科学研究,确保科学研究取得可靠、准确的结果并进而得以发现客观规律;才能使我们从大量的实验数据、实验资料中去揭示和获取更多的化学信息。,数理统计在化学中的应用,第一章 随机变量和分布函数,第一节 几个基本的统计学概念1-1 总体和样本1-2 随机现象1-3 随机变量 离散型随机变量 连续型随机变量,数理统计在化学中的应用,第一章 第一节,$1.1 总体和样本总体:满足指定条件的众多数据的集合有限总体无限总体样本:从总体中抽取一部分实测的个体或单位的集合容量:样本中含有个体的数目样品:组成样本的每一单位或个体,样本,总体,样品,数理统计在化学中的应用,第
13、一章 第一节,$1.1.1 必然事件与随机事件必然事件:满足一定条件后一定发生或一定不发生的事件随机事件:满足一定条件后不一定发生的事件,数理统计在化学中的应用,$1.1.2频率和概率(几率),频率:,概率:,0 P 1必然事件:P=1不可能事件:P=0,数理统计在化学中的应用,Table 1.1.2.1 硬币投掷实验,数理统计在化学中的应用,第一章 第一节,$1.1.3 随机变量实验中所可能出现的结果的量(X)。离散型随机变量随机变量的取值仅仅是有限个,或是可列的无穷多个。连续型随机变量随机变量的取值是充满某一区间的,并且落在任一区间的概率也是确定的。随机变量所取的数值:x,$1.2 分布函
14、数,第二节 分布函数$1.2.1 分布函数的定义、类型和性质$1.2.2 概率密度函数,数理统计在化学中的应用,$1.2 分布函数,$1.2.1 分布函数的定义、类型和性质累积分布函数(Cumulative Distribution Function,CDF):设x是一任意实数或事件,X取得小等于x的数值,的概率为P(Xx),F(x)(=P(Xx)就称为随机变量X的累积分布函数,记为:F(x)=P(Xx),数理统计在化学中的应用,$1.2 分布函数,$1.2.1 分布函数的定义、类型和性质对于任意实数x1,x2,且x1 x2有,Px1xx2=Pxx2-Pxx1=F(x2)-F(x1)因此,若已
15、知x的累积分布函数,就可以知道x落在任一区间(x1,x2)上的概率,在这个意义上说,累积分布函数完整地描述了随机变量的统计规律性。,数理统计在化学中的应用,累积分布函数具有如下性质:,数理统计在化学中的应用,F(x)为增函数,当x2 x1时,F(x2)F(x1)F(x)为右连续,$1.2 分布函数,$1.2.2 概率密度分布函数(Probability Density Function,PDF)对于一维连续实随机变量x,任何一个满足下列条件的函数f(x)都可以被定义为其概率密度函数:,数理统计在化学中的应用,显然,$1.2.3 概率质量函数,概率质量函数(Probability Mass Fu
16、nction,PMF):是离散随机变量在各特定取值上的概率概率质量函数和概率密度函数不同之处在于:概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的取值进行积分后才是概率。离散随机变量概率质量函数的不连续性决定了其累积分布函数也不连续。,数理统计在化学中的应用,$1.2.4 平均值,期望值,偏差,方差,均值,期望值平均值,数理统计在化学中的应用,X的期望值(expectation value),有时用来表示,如果x是连续型随机变量:,$1.2.3 量度数据离散程度(dispersion)的统计量,极差一组数据中最大值和最小值之差,数理统计在化学中的应用,平均绝对偏差,方差(
17、Variance)样本方差,$1.2.3 量度数据离散程度的统计量,方差(Variance)总体方差,数理统计在化学中的应用,标准差(Standard Deviation),相对标准差(Relative Standard Deviation),样本方差 S2 是对总体方差2的无偏估计,$1.2.3 量度数据离散程度的统计量,连续性随机变量的标准差,数理统计在化学中的应用,数理统计在化学中的应用,$1.3 化学中常用的分布函数,$1.3.1 二项式分布$1.3.2 泊松分布$1.3.3 麦克斯威尔分布,$1.3.1 二项式分布,每次试验只有两种可能结果而不受以前试验结果影响的分布。其中一种事件的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 化学 应用

链接地址:https://www.31ppt.com/p-6297315.html