粒子物理与核物理试验中的数据分析课件.ppt
2023-03-18,1,粒子物理与核物理实验中的数据分析,杨振伟清华大学第四讲:蒙特卡罗方法,2023-03-18,2,上一讲回顾,概率的基本概念,随机变量与概率密度函数,随机变量的平均值与方差,能不通过实验对随机变量进行研究吗?,2023-03-18,3,本讲要点,蒙特卡罗方法随机数产生子任意分布抽样之函数变换法与舍选法蒙特卡罗方法中的精度问题在粒子物理与核物理中的应用,2023-03-18,4,蒙特卡罗方法简介,蒙特卡罗方法就是利用一系列随机数来计算各种概率大小和随机变量均值等等的数值分析技术。通常的步骤为:,产生一系列在0,1之间均匀分布的随机数。利用这些随机数按某些概率密度函数 抽样生成我们感兴趣的另一随机序列。利用这些 值来估计 的一些特性,例如:通过找到在区间 的 比例,给出积分值。,第一层面上的应用:,蒙特卡罗计算=积分,第二层面上的应用:,蒙特卡罗变量=“模拟的数据”,2023-03-18,5,随机数的产生,用物理方法产生真正的随机数,不可重复产生速度慢,用数学方法产生伪随机数,可以重复产生的速度快,2023-03-18,6,真随机数与伪随机数,美国兰德(RAND)公司在1950年代,利用真空管中产生的噪音制作了一个含十万个真正的随机数表,并运用于其开展的所有模拟研究中。,真正的随机数与伪随机数之间的区别在于:数据串是否具有可压缩性,即能否用更短的形式来表示。,真正的随机数是不可压缩的,非常不规则,以至于无法用更短的形式来表示它。,在粒子物理与核物理研究中,随机数的可重复性经常也是非常有用的,尤其是程序的调试(debugging)。,2023-03-18,7,随机数产生子,目的是使在 0,1 范围内产生的伪随机数满足:,均匀性;相互独立性;长周期性,乘同余法,友情推荐,2023-03-18,8,CERN库的随机数产生子,PAW用户,gRandom-SetSeed();Float_t random=gRandom-Rndm(1);,Real random(1)Call Rmarin(ISEED,0,0)Call Ranmar(random,1),注意:用于产生子的随机数种子还可以用来保证后续进程的随机数不重复。,Root 用户,粒子物理与核物理研究中,大都采用CERN程序库提供的随机数产生子。,2023-03-18,9,随机数均匀性与相关性检验,subroutine mc double precision lamda,M,x,x0,y call hbook1(10,r,100,0.,1.,0.)call hbook2(20,r(i+1)vs.r(i),&100,0.,1.,100,0.,1.,0.)x0=1.lamda=1220703125!5*13 M=4294967296.!2*32 do i=1,10000 x=Mod(lamda*x0,M)y=x/M call hfill(10,real(y),0.,1.0)if(i.gt.1)call&hfill(20,real(y_old),real(y),1.0)x0=x y_old=y end do return end,随机变量,第 I 个随机变量,第 I+1 个随机变量,频数,均匀性,相关性,2023-03-18,10,随机数均匀性与相关性检验,随机变量,第 I 个随机变量,第 I+1 个随机变量,频数,均匀性,相关性,void random()UInt_t lambda,M,x0;TH1F*h1=new TH1F(h1,100,0,1);TH2F*h2=new TH2F(h2,100,0,1,100,0,1);lambda=1220703125;/513 M=4294967296;/232 x0=1;double y,y_old;for(int i=0;iFill(y);if(i1)h2-Fill(y_old,y);x0=x;y_old=y;,2023-03-18,11,用蒙特卡罗法计算积分,对于计算积分值,解析解:,数值解:,函数必须解析可积,自变量不能太多,对函数是否解析可积和是否太多自变量无要求,在AB区间均匀投总数为N个点。,2023-03-18,12,蒙特卡罗方法中的精度问题,采用蒙特卡罗方法(MC)计算积分与传统的梯形法相比有如下特点,一维积分:,多维积分:,对于维数大于4的积分,用蒙特卡罗方计算积分总是最好。,2023-03-18,13,从均匀分布到任意分布的随机数,函数变换法,舍选法,寻找某个函数,当函数的自变量取均匀分布值时,对应的函数值自动满足给定分布。,从一个随机变量与对应概率密度函数最大值构成的二维均匀分布中,按概率密度函数与自变量关系曲线切割得到。,2023-03-18,14,函数变换法,均匀分布,任意分布,2023-03-18,15,例子:指数分布抽样,抽样效率为100%。,可采用函数变换法抽样的分布,指数分布三维各向同性分布二维随机角度的正、余弦分布高斯分布n 个自由度的 2 分布伽马分布二项式分布泊松分布Student 分布(http:/pdg.lbl.gov/2008/reviews/monterpp.pdf),2023-03-18,16,2023-03-18,17,舍选法,问题:如何找到函数的最大值?,2023-03-18,18,舍选法举例,subroutine acc_rejreal rvec(1)call hbook1(10,x(r),100,0.,10.,0.)call hbook1(20,x(r),100,0.,10.,0.)call hbook2(30,f(x)vs.x(r),100,0.,10.,100,0.,1.1,0.)fmax=-999.do i=1,100 call ranmar(rvec,1)r=0+rvec(1)*(10.-0.)f=0.5*exp(-r/2.)if(fmax.lt.f)fmax=fend dofmax=1.2*fmaxntot=0do i=1,10000 call ranmar(rvec,1)r=0+rvec(1)*(10.-0.)z=0.5*exp(-r/2.),if(z.gt.fmax)then fmax=z*1.2 write(6,*)z greater than fmax end if call hfill(10,r,0.,1.0)call ranmar(rvec,1)u=rvec(1)*fmax if(u.lt.z)then call hfill(20,r,0.,1.0)call hfill(30,r,u,1.0)ntot=ntot+1 end ifend dowrite(6,*)ntot=,ntotreturnend,2023-03-18,19,舍选法举例,void acc_rej()TH1F*h11=new TH1F(h11,100,0,10);TH1F*h12=new TH1F(h12,100,0,10);TH2F*h2=new TH2F(h2,100,0,10,100,0,1);double fmax=-999.;for(int i=0;iUniform(0,10);double f=0.5*exp(-r/2.);if(fmax f)fmax=f;fmax*=1.2;cout fmax=fmax endl;,int ntot=0;for(int i=0;iUniform(0,10);double z=0.5*exp(-r/2.);if(zfmax)fmax=1.2*z;h11-Fill(r);double u=gRandom-Uniform(0,fmax);if(uFill(r);h2-Fill(r,u);ntot+=1;cout ntot=ntot endl;,ROOT脚本,2023-03-18,20,舍选法举例(续),频数,频数,舍选法存在效率问题。,二维均匀分布,2023-03-18,21,函数变换法与舍选法,函数变换法,优点:100%的抽样效率,缺点:函数须解析可积,舍选法,优点:方法简单,可用于非常复杂的函数,缺点:需要估计函数最大值,而且抽样效率低,粒子物理与核物理中,对常用的概率密度函数有各种建议采用的方法(见http:/pdg.lbl.gov/2008/reviews/monterpp.pdf)。除此之外,舍选法最为常用。,初学者常犯的错误:对同一个过程做计算机模拟批处理,没有考虑在批处理结果中存在随机数的重复性。,2023-03-18,22,常用概率密度分布函数的抽样,高斯(正态)分布,gROOT-Reset();hx=new TH1F(hx,“x dis.,100,-10,10);gRandom-SetSeed();Double_t x;const Double_t sigma=2.0;const Double_t mean=1.0;const Int_t kUPDATE=1000;for(Int_t i=0;iGaus(mean,sigma);hx-Fill(x);,产生平均值为mean标准偏差为sigma的高斯分布。,在ROOT环境下采用已有的分布,可以容易完成布置的练习。,2023-03-18,23,蒙特卡罗统计检验,例如常用来检验理论与实验符合好坏的2 分布。,四个服从 N(0,1)正态分布的且相互独立的随机变量平方和,一定符合自由度为 4 的 2 分布,思考:如果出现不符合的情况,该如何解释?,2023-03-18,24,Toy 蒙特卡罗方法,粒子物理与核物理在实验的早期设计阶段,通常利用Toy 蒙特卡罗来估计可达到的测量精度(也称黑盒子方法)。,在不做探测器模拟的情况下,可以对稳定的末态粒子动量各分量进行含高斯分辨率的抽样,能损大小进行朗道分布抽样,寿命进行指数分布抽样,等等,然后在所有末态中寻找中间不稳定态E,根据能动量关系计算其对应的质量,得到的质量分布称为Toy 蒙特卡罗结果。,2023-03-18,25,蒙特卡罗物理产生子,目的:将理论用于某种物理过程的事例产生,输出量:为对应某一物理过程的事例。对于每个事例,给出过程产生的末态粒子和对应的动量,在粒子物理与核物理实验数据分析中,为了验证某一理论或模型,常常需要理论家提供蒙特卡罗物理产生子。,2023-03-18,26,蒙特卡罗物理产生子(续),简单情形,产生 与,粒子物理与核物理中常用的产生子程序包,JETSET(PYTHIA)HERWIGARIADNE,ISAJETPYTHIAHERWIG,KORALWEXCALIBURERATO,2023-03-18,27,蒙特卡罗探测器模拟,从产生子中输入粒子种类与动量,然后模拟粒子的输运过程,模拟探测器响应,多重散射(产生散射角)粒子衰变(产生寿命)电离能损(产生能损)电磁与强子簇射产生信号,电子学响应,输出量=模拟的数据,输入重建分析软件,用途:预测“物理产生子层面上的”给定假设在“探测器层面上”应该观测到的响应。,通用软件包:GEANT3(FORTRAN),GEANT4(C+),粒子与核物理中模拟的应用,用于实验初期的设计阶段建模分析用于了解实验可能遇到物理过程的基本特征用于了解实验仪器自身所受到的各种影响因素与所影响的大小用于数据分析阶段的系统分析,2023-03-18,28,2023-03-18,29,带电粒子在水中的输运过程模拟,给定带电粒子的四动量,单位厘米产生多少光子?,从均匀分布中产生满足一定波长分布的光子,沿期伦科夫光锥方向均匀给所有光子动量,每个光子开始在水中传播,按光与水分子发生作用的概率抽样该光子是否被吸收或散射,2023-03-18,30,2 MeV 电子在水中的输运过程,模拟结果显示了电子在水中发出期伦科夫光,损失能量直至被停止在水中的过程。,入射电子,期伦科夫光子,期伦科夫光子被水吸收,2 米长2 米宽2 米高水立方,空气,水,2023-03-18,31,200 MeV 电子在水中的输运过程,入射电子,2 米长2 米宽2 米高水立方,空气,水,图中只显示能量大于 1MeV 的粒子,原初电子在水中的轨迹,电子韧致辐射产生的光子,光子在水中散射,发生了康普顿效应打出了电子,探测器模拟(几何设置),2023-03-18,32,探测器模拟(物理过程),2023-03-18,33,这种模拟可以提供对探测器效率与预期性能的很好估计。,2023-03-18,34,CERN的蒙特卡罗模拟程序包,GEANT4 是模拟粒子经过物质时所发生的相互作用的一个软件包。它的应用范围包括:,空间科学,医学物理,粒子物理,核物理和加速器物理,http:/geant4.web.cern.ch/geant4,2023-03-18,35,蒙特卡罗方法应用举例,如何确定在实验条件下,理论的概率密度函数,例如:一质量为 m 共振宽度为 的共振态在实验上观察到的概率密度函数是什么形式?,布莱特-魏格纳分布,探测器分辨率,探测效率,贝叶斯定理:,2023-03-18,36,应用举例(续一),也就是说,对应于真实的 M,实际的 M 应该是怎样一个分布,如果假设,2023-03-18,37,应用举例(续二),真实物理的图像在实验观测中会发生变化。如果探测器的影响可以用函数来表达,有时积分可积。但大多数数情况下,不能用函数表示时,蒙特卡罗方法可以给出最好的近似。,2023-03-18,38,应用举例(续三),应用蒙特卡罗方法的步骤:,步骤一:写出布莱特-魏格纳产生子,输出末态粒子的四动量,步骤二:输入末态粒子四动量,模拟粒子在探测器的响应,步骤三:输入各子探测器响应,重建探测粒子的四动量,步骤四:输入探测粒子四动量,计算不变质量分布,输出各子探测器响应,输出探测粒子四动量,实验条件下预期的布莱特-魏格纳分布,2023-03-18,39,小结,蒙特卡罗方法随机数产生子函数变换法舍选法蒙特卡罗方法的精度问题在粒子与核物理中的应用,利用随机数对概率或与概率有关的数值计算,0,1均匀分布 r,相互独立,长周期(伪随机数),事例产生子与探测器模拟,