《计算机地质学》实验指导书.doc
《《计算机地质学》实验指导书.doc》由会员分享,可在线阅读,更多相关《《计算机地质学》实验指导书.doc(33页珍藏版)》请在三一办公上搜索。
1、计算机地质学实 验 指 导 书 西安科技大学地环系二零零六年八月 目 录实验一 预处理与统计1实验二 一元线性回归分析7实验三 多元线性回归分析11试验四 趋势面分析15试验五 聚类分析20试验六 两类判别分析24试验七 贝叶斯多类判别分析28试验八 有序地质量最优分割法32实验一 预处理与统计一、目的:通过完成数据统计和预处理程序的设计和实现及完成算例,掌握统计一组数据的极值、均值、方差、变异系数及进行数据预处理的方法。二、方法概要1、进行统计和预处理的原因、目的和应注意的问题(1)原因原始数据可能有强非对称性,存在孤立值,大多数的统计方法应用原始数据时存在大而且不是偶然的残差等问题,通过改
2、变表达方式,有时可以增强信息的显示,而这种改变不仅需要改变数值的单位,而且可能改变数据的基本测量尺度;(2)目的 使变量尽可能为正态分布(如回归分析要求因变量为正态分布,要求自变量和因变量之间具有足够的相关关系); 统一变量的数据尺度; 使变量之间的非线性关系转换为线性关系; 用新的数目少的相互独立的变量代替相互联系的原始变量; 方便用简单自然的方式进行解释; 帮助理解数据的特征。(3)注意问题 数据范围:只有数据变化范围相对较大,变换才显著; 变换是很重要的工作,变换不当则适得其反;所以在认真研究分析的基础上进行,有时要通过多次试验才能找到合适的变换方法; 有些行业中,有些强制性变换或习惯使
3、用的变换,工作中应遵循; 变换后数据的可解释性也很重要,有时为了不影响解释,宁可不对其转换。三、程序设计框图预处理和统计模块的流程图如图1-1所示。后续的不同多元统计方法对原始数据的分布有不同的要求,但对原始数据都需要进行预处理和统计,所以建议统一输入文件的格式,预处理和统计模块处理后输出文件的格式也按该定义的格式定义。文件的格式建议为:样品个数,变量个数第1个样品号,该样品第1个变量的观测值,第2个变量的观测值,第2个样品号,该样品第1个变量的观测值,第2个变量的观测值,第3个样品号,该样品第1个变量的观测值,第2个变量的观测值,不是所有的原始数据都进行系统的统计和预处理,程序应该提供强大和
4、灵活的人机交互界面,方便用户根据实际情况和需要,选择不同的数据变换方法。图1-1 数据预处理和统计模块流程图四、算例(1)请对以下15个样品数据进行数据统计和数据预处理样品变量12345678911.7661153.48137952.625.7015.279.955.829.60115821.7287603.23419252.522.2038.922.401.041.40157831.7154183.68239061.105.2023.352.782.861.36137241.4593923.98246130.3633.5928.213.090.891.58138351.7383053.505
5、71071.904.0014.592.331.041.55128561.7133233.29393453.581.8037.843.231.091.80156471.7517413.48281566.164.0018.594.461.381.61132081.8536373.46121464.265.9014.275.562.273.98123091.6496273.77359255.807.8023.894.193.112.231350101.7209033.39263951.702.6037.193.362.441.001549111.7379083.47131159.203.7030.4
6、82.751.180.941479121.6318493.82491856.1210.5017.38.372.074.901233131.7204073.29241656.064.6036.001.171.230.311555141.8287893.49714272.886.0514.493.091.041.281290151.7099483.67559567.905.4015.844.392.962.191282实验二 一元线性回归分析一、目的:通过对一元线性回归分析程序设计及完成算例,掌握一元线性回归分析的基本原理和方法。二、方法概要1、原始数据预处理对对原始数据()(=0,1,)数据进行
7、预处理(见实验一)。yz散点图2、数学模型建立(1)作散点图一元线性回归只能处理两个变量之间的关系,它又被称为直线拟合,假设为自变量,为因变量,对预处理后对数据()(=0,1,;其中)如果把各个点数据画在坐标纸上(作散点图),各点近似分布呈一条直线,则可用一元现行回归。(2)选择数学模型 (2-1)(3)参数a, b的估计为根据回归方程的得到的因变量的计算值;a,b为回归方程中的系数;x为自变量。由于测定结果中不可避免会有实验误差,因此用最小二乘法的原理估计回归直线中的系数a,b。假设实验得到了n对数据(i ,y)(i=0,1,n)并得到了回归方程,则对于x的一系列变量x1 ,x2 ,xn,根
8、据回归得到方程可得到因变量的一系列计算值每一个实测值yi(i=0,1,n)与它相对应的一个计算值(i=0,1,n)之间都有偏差,也可称残差,计算公式: (2-2)所有测试数据的残差平方和为 (2-3)如果回归方程是合理的a,b为最佳。则所得到的残差平方和应达到最小值。得 (2-4)列出回归方程 (2-5)3、回归方程显著性检验 (1)将自变量n组试验数据依次代入回归方程(式38),求出因变量n个回归值 () (2-6)(2)计算,和: (2-7) (2-8) (2-9)(3)计算F统计量 (2-10)(4)计算相关系数r (2-11)(5)查表检验给定显著水平,查表得。若或,则证明回归方程显著
9、;否则,回归方程无实用价值。4、对因变量进行区间估计(1)估计剩余标准值 (2-12)(2)求出因变量估计值当自变量取定值时,由回归方程可求得 因变量数学期望的估计值。(3)写出预测区间95%置信区间:()99.7%置信区间:()三、程序设计框图建议对原始数据以以下格式输入:样品个数,2第1个样品号,该样品第1个变量的观测值,第2个变量的观测值第2个样品号,该样品第1个变量的观测值,第2个变量的观测值第3个样品号,该样品第1个变量的观测值,第2个变量的观测值首先要对数据进行预处理,处理完成后,形成以上格式新的文件(详见图11)。以下步骤如流程图(图21)。图2-1 一元线性回归分析模块流程图四
10、、算例(一)从某煤矿采集11个煤样,分别测定煤的发热量()和煤灰分()含量,获得如下表数据:样品号1234567891011(千卡)8.307.87.77.26.86.25.65.55.004.704.30.030.050.080.100.150.200.270.300.340.400.45试建立煤的发热量()对煤灰分()的回归方程,并检验该回归方程的显著性。(二)煤矿脉中13个相邻样本点处某种伴生金属的含量数据如下表:样品号1234567距离x23457810含量y106.42108.20109.58109.50110.00109.93110.49样品号8910111213距离x111415
11、161819含量y110.59110.60110.90110.76111.00111.20试建立y对x的回归方程,并进行显著性检验。实验三 多元线性回归分析一、目的:通过对多元线性回归分析程序设计及完成算例,掌握多元线性回归分析的基本原理和方法。二、方法概要设有自变量,因变量y,共做n次实验。若y与间有线行关系,回归方程则为: (3-1)显而易见,只要确定了各回归系数,方程也就确定了。1、建立原始数据矩阵,并进行必要的预处理(1)确定因变量与自变量,形成行列的矩阵: (3-2)(2)进行预处理(详见图11)2、数学模型建立设经过预处理的原始数据,表示如下 (3-3)由最小二乘法知道,使得全部观
12、察值与回归值的偏差平方和Q达到最小,即使 (3-4)根据微积分学中的极值原理,b0,b1,bn,应是下列方程组: (3-5)35式是求解回归系数的正规方程组,可以写成以下形式 (3-6) (3-7)求解正规方程组,得到各回归系数。列出回归方程 (3-8)3、回归方程显著性检验 (1)将自变量n组试验数据依次代入回归方程(式38),求出因变量n个回归值 () (3-9)(2)计算,和: (3-10) (3-11) (3-12)(3)计算F统计量 (3-13)(4)计算相关系数r (3-14)(5)查表检验给定显著水平,查表得。若或,则证明回归方程显著;否则,回归方程无实用价值。4、对因变量进行区
13、间估计(1)估计剩余标准值 (3-15)(2)求出因变量估计值当自变量取定值时,由回归方程可求得因变量数学期望的估计值。(3)写出预测区间95%置信区间:()99.7%置信区间:()三、程序设计框图建议以实验一的原始数据格式输入,首先要对数据进行预处理,处理完成后,形成实验一的原始数据格式的新文件(详见图11)。以下步骤如流程图(图31)。图3-1 多元线性回归分析模块流程图四、算例(一)、某矿区从18个矿样中测得Cu,Pd,Pt的含量如下所示,试求Pt对Cu和Pd的回归方程,并检验其有无实用价值。编号Cu(%)Pd(g/t) Pt(g/t)编号Cu(%)Pd(g/t)Pt(g/t)10.36
14、0.1690.176100.060.0230.04520.050.0350.020110.530.3290.29230.240.2480.262120.060.0650.08040.050.0150.035130.210.2830.23550.220.2160.234140.030.0300.03060.130.0860.092150.330.210.23770.101.3001.669160.010.0300.05080.070.0090.006170.210.2520.2490.160.1600.150180.080.0530.103(二)、由于碳、氢、氧是煤燃烧过程中产生热量的主要元素,
15、对某矿(褐煤、常烟煤、肥煤、焦煤和无烟煤)中取12块煤样,经分析化验后,其发热量(焦耳/克)与Cr(%)、Hr(%)、Or(%)元素的数据如下。问:今后能否不再对该矿煤进行发热量测定,而由元素分析结果对其进行预测?编号Cr(%)Hr(%)Or(%)(J/g)编号Cr(%)Hr(%)Or(%)(J/g)1625.0156.57856.06.08.42706.0207.08883.03.08.53756.5257.29905.05.08.84755.0107.510902.52.58.05785.5157.711923.03.08.56805.24.08.012953.53.58.7试验四 趋势面
16、分析一、目的:通过趋势面分析程序设计及完成算例,掌握趋势面分析方法原理及工作步骤。二、方法概要1、建立原始数据矩阵,并进行必要的预处理(1)选取应变量选取什么样的变量进行趋势分析,取决于研究对象和研究目的。(2)确定控制点在确定控制点时,一般要考虑以下几个方面:控制点的代表性、真实性和可靠性。控制点要具有面性、均匀、随机分布的特点。(3)整理原始数据统计表收集因变量观测值及相应坐标,填入趋势分析原始数据统计表,其格式可参考表4.1 。表4.1 趋势分析原始数据统计表格式编 号控制点坐标变量顺序号原编号横坐标()纵坐标()其中“控制点坐标可以是地理坐标,也可以是虚拟坐标系的相对坐标。(4)建立原
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机地质学 计算机 地质学 实验 指导书

链接地址:https://www.31ppt.com/p-4190663.html