概率论历史 (2).doc
一、概率论的起源概率论同其他数学分支一样,是在一定的社会条件下,通过人类的社会实践和生产活动发展起来的一种智力积累。今日的概率论被广泛应用于各个领域,已成为一棵参天大树,枝多叶茂,硕果累累。正如华裔数学家、概率学家钟开莱1974 年所说:“在过去半个世纪中, 概率论从一个较小的、孤立的课题发展为一个与数学许多其它分支相互影响、内容宽广而深入的学科。”概率论发展的每一步都凝结着数学家的心血, 正是一代又一代数学家的辛勤努力才有了概率论的今天。人类认识到随机现象的存在是很早的。从太古时代起, 估计各种可能性就一直是人类的一件要事。早在古希腊,哲学家就已经注意到必然性与偶然性问题; 我国春秋时期也已有可考词语(辞海) ; 即使提到数学家记事日程上的可考记载, 也至少可推到中世纪1 。 有史记载15世纪上半叶,就已有数学家在考虑这类问题了。 如在意大利数学家帕乔利(L. pacioli)1494 年出版的算术一书中就有以下问题: 两人进行赌博, 规定谁先获胜6场谁为胜者。 一次, 当甲已获胜5场, 乙也获胜2 场时, 比赛因故中断。那么, 赌注该如何分配呢?所给答案为将赌注分成7 份, 按5: 2 分给甲乙两人。 当卡丹( Cardan Jerome, 15011576) 看到上述问题时, 以为所给分法不妥。 他考虑到接下去比赛的几种可能结果, 并确定赌注应按10: 1 来分配( 现在看来, 其分法也是错误的) 。 卡丹著有论赌博一书, 其中提出一些概率计算问题。 如掷两颗骰子出现的点数和的各种可能性等。 此外, 卡丹与塔塔利亚(Tartaglia Niccolo, 15001557) 还考虑了人口统计、保险业等问题。 但是他们的研究工作, 对数学家来说, 赌博味道太浓了一些, 以致数学家们对其嗤之以鼻。 近代自然科学创始人之一伽利略(Galileo, 1564 1642) 解决了以下问题: 同时投下三颗骰子, 点数和为9 的情形有6 种: ( 1, 2, 6)、( 1,3, 5)、( 1, 4, 4)、( 2, 2, 5)、( 2, 3, 4) 和(3, 3, 3) 。 点数和为10 的情形也有6 种: ( 1, 3, 6)、( 1, 4, 5)、( 2, 2,6)、( 2, 3, 5) ( 2, 4, 4) 和(3, 3, 4) , 那么出现点数和为9 与10 的机会应相同, 而经验告知, 出现10 的机会比出现9 的机会要多, 原因何在?伽利略利用列举法得出同时掷三颗骰子出现点数和为9 的情形有25 种, 而出现点数和为10的情形却有27 种。可见, 已经产生了概率论的某些萌芽2。1654 年7 月29 日, 法国骑士梅累向数学神童帕斯卡( pascal, 16231662) 提出了一个使他苦恼很久的问题:两个赌徒相约若干局, 谁先赢了S 局则赢。 若一人赢a( a < s ) 局, 另一人赢b( b <s) 局, 赌博中止, 问赌本应怎么分? 帕斯卡对此思考良久, 又将其转给业余数学王子费马(Fermat, 1601 1665) 。3 在数学史上有名的来往信件中, 两人取得了一致意见: 在被迫停止的赌博中, 应当按每个局中人赌赢的数学期望来分配桌面上的赌注。 帕斯卡与费马用各自不同的方法解决这个问题, 帕斯卡长于计算, 运用数学归纳法,推导出数学内含的规律性, 而费马以敏锐的观察力, 严格的推理, 建立起数学概念。以s = 3, a = 2, b = 1 为例来说明他们的解法。 即谁先胜3 局, 则可得到全部赌注, 在甲胜2局, 乙胜1 局时, 赌局中止了, 问怎样分配赌注才算公平合理。帕斯卡分析认为: 甲已胜2局, 乙也胜1 局, 如再赌一局, 则或者甲大获全胜, 赢得全部赌金, 或者乙胜, 则甲与乙胜的局数变成相等, 甲、乙应平分赌金。 把这两种情况平均一下, 甲应得赌金的3/ 4, 乙则得赌金的1/4。费马认为: 由甲已胜a 局, 乙已胜b 局, 要结束这场赌博最多还需要赌( s- a)+ ( s- b) - 1局, 在这个例子中, 最多还需要玩两局, 结果有四种等可能的情况: ( 甲胜, 甲胜), ( 甲胜, 乙胜) , ( 乙胜, 甲胜) , ( 乙胜, 乙胜) 。在前面三种情况下, 甲赢得全部赌金, 仅第四种情况使乙获得全部赌金。 因此甲有权分得赌金的3/ 4, 而乙应分赌金的1/4。帕斯卡在他的著作论算术三角形中给出了这一问题的通解: 令m = s- a, n = s- b, 则甲乙两人应得赌金之比为/费马和帕斯卡虽然没有明确定义概率的概念, 但是, 他们定义了使某赌徒取胜的机遇, 也就是赢的情况数与所有可能情况数的比, 这实际上就是概率, 所以概率的发展被认为是从帕斯卡和费马开始的。 正如对概率论有卓越贡献的法国数学家泊松(poisson, 1781 1840) , 后来所说: 由一位广有交游的人向一位严肃的冉森派所提出的一个关于机会游戏的问题乃是概率演算的起源4。当荷兰数学家惠更斯(C. Huygens, 16291695)到巴黎的时候, 听说帕斯卡与费马在研究概率问题, 便也参与进来, 并于1657 年出版了论赌博中的计算一书。书中给出了第一批概率论概念和定理(如加法定理、乘法定理) 。5关于“数学期望”是这样提出的: “ 在赌局开始之前,对每一个赌徒来说就已有了关于结局的一种期望 , 如果共有N 种等可能的结果, 其中, n 种结果使他获赌金为a, 其余结果使他获得赌金为b, 则他的期望为na+ (N - n) b/N。在概率论的现代表述中, 概率是基本概念, 数学期望则是第二级的概念, 但在历史上, 顺序却相反, 先有“期望”概念, 而古典概型的概率定义, 完全可以从期望概念中导出来。并且写成了论机会游戏的计算一书,这就是最早的概率论著作。因此,可以认为概率论从此诞生了6。二、概率论的数学分支近几十年来,随着科技的蓬勃发展,概率论大量应用到国民经济、工农业生产及各学科领域。许多兴起的应用数学,如信息论、对策论、排队论、控制论等,都是以概率论作为基础的7。概率论和数理统计是一门随机数学分支,它们是密切联系的同类学科。但是应该指出,概率论、数理统计、统计方法又都各有它们自己所包含的不同内容。概率论是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性作出一种客观的科学判断,对这种出现的可能性大小做出数量上的描述;比较这些可能性的大小、研究它们之间的联系,从而形成一整套数学理论和方法。数理统计是应用概率的理论来研究大量随机现象的规律性;对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明;并判定各种方法应用的条件以及方法、公式、结论的可靠程度和局限性。使我们能从一组样本来判定是否能以相当大的概率来保证某一判断是正确的,并可以控制发生错误的概率。统计方法是以提供的方法在各种具体问题中的应用,它不去注意这些方法的的理论根据、数学论证。应该指出,概率统计在研究方法上有它的特殊性,和其它数学学科的主要不同点有:第一,由于随机现象的统计规律是一种集体规律,必须在大量同类随机现象中才能呈现出来,所以,观察、试验、调查就是概率统计这门学科研究方法的基石。但是,作为数学学科的一个分支,它依然具有本学科的定义、公理、定理的,这些定义、公理、定理是来源于自然界的随机规律,但这些定义、公理、定理是确定的,不存在任何随机性。第二,在研究概率统计中,使用的是“由部分推断全体”的统计推断方法。这是因为它研究的对象随机现象的范围是很大的,在进行试验、观测的时候,不可能也不必要全部进行。但是由这一部分资料所得出的一些结论,要全体范围内推断这些结论的可靠性。第三,随机现象的随机性,是指实验、调查之前来说的。而真正得出结果后,对于每一次实验,它只可能得到这些不确定结果中的某一种确定结果。我们在研究这一现象时,应当注意在实验前能不能对这一现象找出它本身的内在规律。概率论不仅是“数学之树” 的一庞大支条, 而且还有若干强壮的根(如下表),直接扎在实际应用环境的大地上。“芳草有情皆碍马, 好云无处不遮楼。” 正如英国的逻辑学家和经济学家杰文斯( Jevons, 1835 1882) 所说, 概率论是“生活真正的领路人, 如果没有对概率的某种估计, 我们就寸步难行, 无所作为。”8三、现代中学教学中的主要研究课题:以随机事件为例概率论是现代中学教学中必不可少的重要的一部分。比如初中教学中的统计初步问题(包括中位数、平均数和概率分布),还有高中教学中的排列、组合和二项式定理等,都是重要的概率问题,下面重点介绍随机事件及其概率:(一)随机事件的概念:在一定条件下可能发生也可能不发生的事件,叫做随机事件。(二)随机事件的概率的定义: 在大量重复进行同一试验时,事件A 发生的频率m/n 总是接近于某个常数,在它附近摆动,这时就把这个常数叫做事件 A 的概率,且0P(A) 1。例1:历史上曾有人做过抛掷硬币的大量重复试验,结果如下表 :正面次数m(m为频数)抛掷次数:n频率( m/n )106120480.5181204840400.50696019120000.501612012240000.500514984300000.499636124720880.5011由上表可知:当抛掷硬币的次数很多时,出现正面的频率值是稳定的,接近于常数0.5,在它附近摆动。结论:随机事件在一次试验中是否发生虽然不能事先确定,但是在大量重复试验的情况下,它的发生呈现出一定的规律性。出现的频率值接近于常数。例2:某批乒乓球产品质量检查结果表:优等品数m459219447095541902抽取球数n5010020050010002000优等品概率m/n0909209709409540951当抽查的球数很多时,抽到优等品的频率m/n 接近于常数0.95,在它附近摆动。例3:某种油菜籽在相同条件下的发芽试验结果表:结论:当试验的油菜籽的粒数很多时,油菜籽发芽的频率m/n接近于常数0.9 ,在它附近摆动。事件A的概率的定义: 一般地,在大量重复进行同一试验时,事件 A 发生的频率 m/n (n为实验的次数,m是事件发生的频数)总是接近于某个常数,在它附近摆动,这时就把这个常数叫做事件 A 的概率,记做P(A)=P。由定义可知: (1)求一个事件的概率的基本方法是通过大量的重复试验; (2)只有当频率在某个常数附近摆动时,这个常数才叫做事件A 的概率; (3)概率是频率的稳定值,而频率是概率的近似值; (4)概率反映了随机事件发生的可能性的大小;(5)必然事件的概率为1,不可能事件的概率为0。因此0P(A) 1。四、概率论在生活中的实际应用价值随着社会的发展,概率论在工农业生产、国民经济、现代科学技术等方面具有广泛的应用, 现代生活更是与概率有着千丝万缕的联系。另外,介绍买彩票问题等。本文举几个现实生活中的概率问题的具体例子, 供读者参考11。(一)“生日相同的机会有多大” 一个经同学们实地调查提出的概率问题我们知道“366人中至少有 2人同月同日生”是必然事件, 可据同学们调查, 我校30个班级(每班人数都在50至54之间)都有“ 至少有 2人同月同日生”的事件发生, 难道这也是必然事件吗?例一 : 我班有50个同学, 那么我班出现同月同日生的同学的机会有多大?分析:任意两个人的生日相同的可能性为0.0000075, 确实非常小, 那么对于一个班而言, 这种可能性是不是也不大呢?正面计算这种可能性的大小并不简单, 因为要考虑可能有2个人生日相同, 3个人生日相同有50个人生日相同的这些情况。如果我们从反面来考察, 即计算找不到两个人生日相同的可能性, 就可知道最少有两个人生日相同的可能性。对于任意2个人, 他们生日不同的可能性是;对于任意2个人, 他们中没有生日相同的可能性是;类似可得, 对于50个人, 找不到两个生日相同的可能性是,因此,50个人中至少有两人生日相同的机会达97,这么大的可能性有点出乎意料, 然而事实就是如此, 我校“同月同日生”的具体情况就证明了这一点。但是,“50个人中至少有2人生日相同”不是必然事件, 虽然它的概率很大(0.97), 但不是1, 故它仍是随机事件, 我校30个班级都出现了“至少有两人生日相同”, 纯属“巧合”。(二)“ 张老师的指责有道理吗” 一个抽样估计的概率问题如今的社会可以说是一个商品社会, 有的商家为了牟取暴利竟大作虚假广告, 这需要消费者有一双雪亮的眼睛, 通过实地抽样调查来估计商品的质量。例二:张老师在果品批发市场上打算买几箱梨, 他询问卖主所售梨的质量如何, 卖主说一箱里(假设为100个)顶多有四、五个坏的。张老师随后挑了一箱, 打开后看到第一层有10个梨, 心想这10个中有不多于2个坏的就买, 可他发现10个梨中有3个是坏的(设这10个梨是随机抽取的)。于是张老师对卖主说, 你的一箱梨里不止有5个坏的。卖主反驳说, 我的话并没有错, 也许这一箱梨中就这3个坏的, 让你碰巧看见了。张老师的指责有道理吗?分析:假设一箱里有100个梨, 其中有5个坏的。根据古典概率的定义, 我们知道所抽取的10个中坏梨数等于3的概率为p(x=3)=; 类似可求得坏梨数为4、5的概率分别为p(x=4)=;p(x=5)=。故抽取10个中坏梨数大于2的概率p(x>2)=p(x=3)+p(x=4)+p(x=5)0.006647。这表明, 一次抽取10个, 发现多于2个坏的概率很小, 几乎是不可能的, 现在居然发生了, 这说明张老师的指责是有道理的。本例反映了“先尝后买”中的数学道理, 即抽样调查的方法。先尝后买决定买不买比不尝就买的风险要小, 但风险依然存在。看了上述几例, 您是否觉得“概率”并不神秘,它就在我们身边, 那么就请您关注我们丰富多彩的生活吧, 因为这里处处有数学。(三) 根据以下材料, 分析中奖情况:例三 : 下表是2000年江苏省第二十五期体育彩票的中奖情况, 请算出每个奖的中奖概率。奖项中奖号码中奖人数每人获奖金额(元)特等奖334859(特别号3)3644557一等奖334859896683二等奖33485x x345896517849三等奖3348xx x3458x xx4859501300四等奖334xxx x348xx xx485x xxx8592213320五等奖33xxxx x34xxx xx48xx xxx85x xxxx592449575说明:购买江苏体育彩票时, 需选取一个六位数作为彩票号码, 第一位可以是0 , 数字也允许重复, 如666666等, 可以购买指定号码, 也可以由电脑随机选号, 购买数量不限(一个号码2元)。另外, 选定六位数的号码后, 还要在0、1、2、3、4这五个数中挑选一个所谓的“特别号”, 以兑特等奖之用。分析:用P表示中特等奖的概率, 表示获i等奖的概率(i=1,2,3,4,5)。因为六位数共有个,特别号有5种选择,故P=,即特等奖的中奖率为五百万分之一。,。从以上计算不难看出, 中特等奖、一等奖和二等匀的概率极低, 要想在一夜之间成为“巨富”简直比登天还难。因此, 买彩票要有一颗平常心, 买彩票的主要目的是献爱心, 而不是赢利, 倘若孤注一掷, 极有可能得不偿失, 后悔莫及。买彩票不是一种投资行为, 而是一种献爱心式的娱乐性消费, 我们不能指望它有规律的回报, 只是碰碰运气而已12。五:许宝騄对概率论与数理统计的卓越贡献许宝騄( 19101970年)是20世纪中最富有创造性的统计学家之一, 是中国最早在概率论与数理统计研究方向达到世界先进水平的杰出数学家。他加强了强大数定律; 研究了中心极限定理中误差大小的精确估计; 发展了矩阵变换技巧; 得到了高斯·马尔科夫( GaussMarkov)模型中方差的最优估计; 揭示了线性假设似然比检验的第一个优良性质等2 。其研究成果已经成为当代概率论与数理统计理论的重要组成部分, 至今“许方法”仍被认为是解决检验问题的最实用方法13。少年时代的许宝騄受益于表姐夫徐传元(毕业于美国麻省理工学院)的指导。1928年, 许宝騄考入燕京大学化学系, 但对数学的浓厚兴趣, 促使他改攻数学, 并于1930年考入清华大学数学系。期间, 深受熊庆来( 18931969年)、孙光远( 19001979年)和杨武之( 18961973年)的教诲。1933年, 以优异成绩获得理学士学位。1936年, 通过赴英庚子赔款公费留学考试, 进入伦敦大学学院( Un iversity Co llege )的高尔顿( Franc is Ga ldon,18221911)实验室和统计系学习数理统计学。1938年获得哲学博士学位, 两年后又获得理学博士学位 。1880年, 英国学者傅兰雅( John Fryer, 18391928 )和中国数学家华蘅芳( 18331902年)合译的决疑数学是传入我国的第一部概率论著作。由于种种因素, 该书对我国的概率论发展没有产生多大影响。辛亥革命后, 微积分、近世代数、近世几何学等相继进入我国的高等教育领域, 而概率论尚未进入。1915年1月创刊的中国第一份现代科学杂志科学曾刊出一篇文章最小二乘式, 此为我国第一篇概率论文章。后胡明复( 18911927年)曾撰写几率论、误差论等一系列论文探讨概率统计的哲学问题4 。由于受中国传统数学思想的影响, 加之近代数学基础薄弱, 随机数学在我国发展甚是缓慢。直到20世纪30年代, 我国数学家褚一飞、刘炳震、许宝騄、钟开莱等才陆续发表概率论与数理统计的研究论文, 拉开了中国对概率论与数理统计研究的序幕。许宝騄痛感中国数学之落后, 怀着满腔的报国热情, 决心把自己的事业立足于祖国。由于概率论与数理统计在中国几乎是空白的学科领域, 于是, 许宝騄以惊人毅力和无私奉献精神为其奠定了基础, 并为之振兴付出了毕生精力。在实际工作及理论问题中, 概率接近于1或0的随机事件具有重要意义。概率论的一个基本问题就是探索概率接近于1的规律, 特别是大量独立或弱相依因素累积结果所发生的规律。大数定律就是研究这种规律的命题之一。许宝騄对大数定律进行了深入探讨。强大数定律和弱大数定律取决于收敛的类型。第一个弱大数定律由雅可布·伯努利( Jacob Bernou ll,i 16541705) 提出, 刻画了大量经验观测中呈现的稳定性。后泊松( Simon Den is Po isson, 17811840)又提出了一个条件更宽的陈述, 即泊松大数定律。切比雪夫( P. L. Chebyshev, 18211894)第一次严格地证明了伯努利大数定律, 并把结果推广到泊松大数定律。1866年, 切比雪夫给出著名的切比雪夫不等式, 并由此导出切比雪夫大数定律。第一个强大数定律由法国数学家博雷尔( Ema il Bore,l 18711956)在1909年对伯努利试验场合建立。他证得若试验次数无限增加时, 频率将趋于概率。博雷尔的工作激起了数学家沿这一崭新方向的一系列探索, 其中尤以柯尔莫戈罗夫( A. H. Ko lmogorov,19031987)的研究最为卓著。他在1926年推导了弱大数定律成立的充分必要条件, 后又对博雷尔提出的强大数定律给出了一般结果。许宝騄进一步加强了强大数定律的结论。其结果为: 设X 1, X 2, &, X n, &是独立同分布均值为零、方差有限的随机变量序列, 任给> 0, 有证明是经过一个卷积的富立叶逆转, 把问题转化为含有特征函数某个积分的分片估计, 这需要具有相当深厚的数学功底和敏锐的数学眼光才能完成。由于推证较复杂, 尽管已经得出关于矩的充要条件, 但在刊出时删去了必要性的证明 。概率论中的极限定理研究的是随机变量序列的某种收敛性, 对随机变量收敛性的不同定义将导致不同的极限定理。许宝騄在“依分布收敛”、“依概率收敛”、“ r阶收敛”和“依概率1收敛”的基础上, 创造性地提出“完全收敛性”概念, 开辟了概率论极限理论研究的新局面。直到今天, 对完全收敛性的讨论仍是一个有意义的课题, 这就足以表明该文的开创性价值。正如许宝騄所说: “一篇论文不能因为获得发表就有了价值。其真正价值要看发表后被引用的状况来评价。”许宝騄对中心极限定理也进行了较为深入的研究。“ 中心极限定理”这个术语是由波利亚( G. Po lya, 18871985) 1920年引入的。该定理断言在适当条件下, 大量独立随机变量和的概率分布近似于正态分布。在长达两个世纪的时间内极限定理成了概率论的中心课题。许宝騄把数学家分成三流。第一流的数学家是天才, 他们能开创新的领域, 如柯尔莫哥洛夫、诺依曼( John von N eumann, 19031957)、维纳( NorbertW iener, 1894 1964)等。第二流数学家是靠刻苦学习而成功的。他们认真消化整理前人的东西, 在此基础上有所创造和发现, 辛钦就属于这一类。第三流的数学家只是在某个问题上有所贡献, 不能像第二流的那样系统工作。剩下的就是不入流的数学家了。他认为自己没有才能, 所有成就完全是靠刻苦学习而获得。“三十功名尘与土, 八千里路云和月”。许宝騄对科学研究的态度和精神永远值得我们借鉴和学习14。参考文献:1 高隆昌,胡勋玉著.数学纵横.成都: 四川教育出版社, 1992,p642 吴文俊. 世界著名数学家传记M . 北京: 科学出版社, 1990.3BB鲍尔加尔斯基著数学简史中译本 , 知识出版社,1984,第143页.4 张奠宙. 中国近现代数学的发展M . 石家庄: 河北科学技术出版社, 2000.5李文林.数学史教程(M).北京: 高等教育出版社, 2000, 8.6张奠宙.数学史选讲(M) .上海: 上海科学技术出版社,1998, 2.7 盛骤,谢式千,潘承毅. 概率论与数理统计M. 北京:高等教育出版社,1989.(Sheng Zhou,Xie Shiqian,PanChengyi.ProbabilityTheory and Mathematics StatisticsM. Beijing:HigherEducationPress,1989.(in Chinese)8 刘次华,万建平. 概率论与数理统计M. 北京:高等教育出版社,1999. (Liu Cihua,Wan Jianping. Probability Theory and MathematicsStatisticsM. Beijing:Higher Education Press,1999.(in Chinese)9 PaoLuH su, Robb insH. C om p lete Convergence and th e Law ofLargeNum ber J . P roc. N a t. Acad. S ci. U. S. A. , 1947,33: 25! 31.10 李思一, 白葆林译.从惊讶到思考.北京: 科学技术文献出版社, 1982, p6411 Richard A。 Epst ein .赌博的理论和统计的逻辑(M) .Academic press, 1987.12徐传胜.运用实际问题改进概率统计教学 J 数学教育学报, 2000, 11(4).13王梓坤.科学发现纵横谈(M).北京: 北京师范大学出版社,1996,6.14 江泽涵, 段学复. 深切怀念许宝騄教授 J . 数学的实践与认识, 1980, ( 3) : 13.