分析化学中的误差与数据处理ppt课件.pptx
分析化学中的误差与数据处理,分析误差、结果表达、分析结果的检验,示例1:称硬币,小于3.094:46个大于3.094:54个,示例2、投镖,1、可以从两个方面描述一组重复测定的数据,集中:离散:,0.018,平均值:3.094,平均值与标准偏差,3.094,数学描述,相对于平均值,2、分析结果的好坏可以从两个方面来评价,练习,例题1:例题2:,问题:1、误差和偏差公式能否反映测量结果的准确度和精密度?,2、两组测量的偏差,第二组:0.0, +0.1, -0.7, +0.2, -0.1, -0.2, +0.5, -0.2, +0.3, +0.1,第一组:+0.3, -0.2, -0.4, +0.2, +0.1, +0.4, 0.0, -0.3, +0.2, -0.3,计算平均偏差和标准偏差差,结果说明什么问题?,取样误差 方法误差 仪器误差 试剂误差 个人误差,3、误差及其分类,随机误差:偶然因素引起,不可避免-不可测误差。服从统计规律,多次测定可以减小,无法完全消除,系统误差:使测定结果系统性的偏高或偏低,在相同条件下会重复出现-是可测的,可以减小和消除的,4、准确度与系统误差,存在系统误差,消除系统误差后,消除系统误差的前提下,一组平行测定的平均值是最可信赖的,它反映结果的集中趋势。常以平均值来表示测定结果。消除系统误差的情况下,以平均值来估计真值,5、精密度与随机误差,表明分析结果的重复性,重复性不好,6、消除系统误差之后(随机误差的正态分布),频 数 分 布,无限多次测定,总体标准偏差,正态分布曲线,x(测量值),正态分布概率密度函数,概率,正态分布曲线/高斯曲线,两个重要参数: 1、:集中。曲线最高点,决定曲线的位置2:离散。决定曲线的形状。,越小,越尖锐,数据越集中,1、小误差出现的概率大,大误差出现的概率小;x=时概率最大,特别大的误差出现的概率极小。(绝大多数测量值集中于此)2、正误差出现的概率与负误差出现的概率相等。(无限多次测定),消除系统误差之后,测量受随机误差制约。随机误差受统计学控制。,1、一组重复测定的数据可以从 和 两方面来,评价数学上用什么 和 表示。 2、测量结果的好坏可以从 和 两方面来评价,数学上用什么 和 表示。3、消除系统误差之后测量数据服从 分布,存在系统误差呢 ?4、消除系统误差之后,无限次测量的平均值()等于 。 5、正态分布的中心位于 ,曲线的形状由 决定?曲线在x轴上的位置由 决定。6、正态分布的其它特点:,7、概率积分,正态分布曲线下的面积代表了区间包含测量值的概率。其中:1、曲线下的总面积为1。2、无限次测量中,0误差出现的概率最大,大误差出现的概率小。,x,x1 x2,y,8、标准正态分布(u分布,正态分布的标准化),u是以为单位的偏差,0.399,数学表达式,N(0,1),或者直接令=0,=1也可得到,特点:1、与,无关.曲线都相同,应用更为方便2、以为0中心3、曲线下面积1,99.7%,68.3%,95.5%,实际测量中,偏差超过3的数值则可舍去,x=x=2x=3,0.15%,0.15%,示例,已知某试样铜含量为1.48%,=0.10%,测量时候没有系统误差,求分析结果落在1.480.10%范围内的概率。,x1 x2,查表p57页,已知某试样铜含量为1.48%,=0.10%,测量时候没有系统误差,求分析结果大于1.70%的概率。,P(02.2)=0.4861P(2.2)=0.5-0.4861=0.0139,双边问题查(算)双边概率,单边问题查算单边概率,1.39%,9、t分布(少量数据的统计处理),无限多次测量:,,有限次测量:,m个样本,每个样本做n次测定,m个平均值的标准偏差,S:单次平行测定的标准偏差,只能用有限的数据估计,,f=1f=4f=8f=12N(0,1),t,F大于20和N(0,1)很接近,-4t -3 -2 -1 0 1 2 3 4t,1、以0为中心2、对称3、面积=14、形状与f有关,f越大,越接近N(0,1)5、t的取值与P有关.置信度越大,t值越大f越大,t越小,t分布的特点,f=1f=4f=8f=12N(0,1),P61:t值表,对于少量数据,必须按t分布进行处理,表示在一定置信水平下,以样本测量的平均值为中心,包括总体平均值的范围,平均值的置信区间(测量结果的表达),练习,例题10某铜矿中铜含量的测定结果为:40.53%,40.48%,40.57%,40.42%,计算置信度为90%,95%,99%时的总体平均值的置信区间。,1、一组重复测定的数据服从 分布。2、正态分布的中心位于 ,曲线的形状由 决定?曲线在x轴上的位置与 有关。3、对正态分布概率密度函数进行积分运算时,有两个参数: ,使得对不同的测量对象或采用不同的测量方法时需要重新进行积分。4、为此,可以将正态分布转换为 分布,也称为 分布,记作 。该分布以 为中心,横坐标为 。5、无限次测量可以得到 和 两个参数,因此可以得到正态分布或标准正态分布,但有限的测量只能得到 和 (或 ),相应的分布规律为 分布。该分布以 为中心,横坐标为 。6、t值与 和 有关。7、平均值的置信区间,表示的意思是: 。分析结果应该以平均值置信区间的形式报出。,1、分析误差有 和 两种,前者影响 数据的 ,后者影响数据的 。2、 误差必须消除, 误差无法消除,多次测量可以减小。3、一组无限次重复测定的数据的随机误差(偏差)服从 分布。少量数据时,可以用 分布来估计正态分布。,t,10、显著性检验(数据间的比较),分析测试目标是准确测量被测量量值。为此,在进行分析测试程序的同时,经常会将分析结果和标准物质(样品)的分析结果进行比较,或者是在不同操作人员之间、不同的实验室之间、不同方法之间进行比较。但由于随机误差不可避免,不同的分析测试之间必然会有差异。通过统计检验,如果这种差别是由随机误差引起的,则认为二者没有区别,否则,则认为有显著差异,某一测试系统中可能存在系统误差。,第一种如图a所示,两组分析结果的分布曲线完全分离。很明显,这两组测量之间有明显的差别,或者谓之显著性差异。第二种如图b所示,二者之间重合程度很高,表明二者之间的差别是由随机误差引起的,没有显著性差别。对于c则没有前两种那么明显,到底有没有显著性差异,需要经过显著性检验。,显著性差异,非显著性差异,校正等,正常,a,c,b,x,1,2,1,2,1,2,10.1 t检验,平均值与标准值比较,根据置信度水平和自由度,由t值表查出相应的ta,f 值。如果计算出的tta,f ,则 有显著性差异,分析过程中存在系统误差;否则应视为二者的差异由随机误差引起,即,P63页:例题11,10.2 F检验,通过比较两组数据的方差,可以考察二者精密度有无显著性差异。,根据置信度水平和自由度,查F值表查得F a,f ,如果计算出的FF a,f ,则认为在该显著性水平下,二者有显著性差别,否则没有。,P65页:例题13,10.3 t检验和F检验,同一试样两组平均值的比较,先比较精密度,再比较两平均值,P65页:例题12,11、可疑值的取舍,11.1 法,当测量次数超过20次,=0.8,总体平均偏差,超过3 的概率小于0.3%,因此可以舍去,即舍去偏差大于4 的数据。少量数据,可用 代替4 ,11.2 格鲁布斯法,n个按递增顺序排列的数据,x1xn,可疑值只可能是x1和xn,计算统计量,如果在P置信度下, ,舍去,否则保留,11.3 Q检验法,n个按递增顺序排列的数据,x1xn,可疑值只可能是x1和xn,计算统计量,练习,例题15例题16例题17,12、标准曲线与回归分析,浓度,mol/L,信号,Cx,A,标准曲线,不能随意外推,用EXCEL求回归方程和相关性系数,含量x,g:0.0 2.0 4.0 6.0 8.0 10.0 12.0荧光强度y: 2.1 5.0 9.0 12.6 17.3 21.0 24.7,最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。,其中,相关性系数,相关性系数的检验,P71页,13、提高分析准确度的方法,1.方法是否合适2.减小随机误差3.消除系统误差 对照试验 空白试验 校准仪器 分析结果校正,偏差的其它表示方法,公差,误差的传递,有效数字,有效数字=准确数字+一位估计数字,是实际能测到的数字,m 台秤(称至0.1g):12.8g(3), 0.5g(1), 1.0g(2) 分析天平(称至0.1mg):12.8218g(6), 0.5024g(4), 0.0500g(3)V 滴定管(量至0.01mL):26.32mL(4), 3.97mL(3) 容量瓶:100.0mL(4),250.0mL (4) 移液管:25.00mL(4); 量筒(量至1mL或0.1mL):26mL(2), 4.0mL(2)pH:5.01(3) H+ =9.810-6,禁止分次修约,运算时可多保留一位有效数字进行,0.5749,0.57,0.575,0.58,4舍6入,50看单双5后面还有任何数,向前进1,修 约,0.24574 0.24570.24575 0.24580.24576 0.24580.24585 0.24580.245851 0.2459,52,加减法:以小数点后位数最少的数字为准。 绝对误差最大,运算规则,0.0121+25.64+1.05782 =0.01+25.64+1.06 26.71,50.1+1.45+0.5812 =50.1+1.4+0.6 52.1,乘除法: :以有效数字位数最少的为准。相对误差最大,0.012125.641.0578=0.012125.61.060.328432,可以先修约再计算,也可以计算后再修约。(用计算器运算),