《有序地质量最优分割法.docx》由会员分享,可在线阅读,更多相关《有序地质量最优分割法.docx(13页珍藏版)》请在三一办公上搜索。
1、第七章 有序地质量最优分割法第一节 概 述 地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难。因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层,提出了“有序地质量最优分割法”。 地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这
2、些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。 设有个按顺序排列的样品,每个样品测得个变量,这批数据可用数据矩阵的形式表示为其中,表示第个样品第个变量的取值。 若对以上个有序样品进行分割(分段),可能有 种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数
3、据的组间离差平方和最大)。这种对个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。 样品变量总离差平方和的分解式为 (71)式中,为总离差平方和;为组内离差平方和;为组间离差平方和。由式(71)可知,如果个样品分为段,每段的样品个数为,若每个样品只取一个变量,则 (72) (73)因此,寻求最优分割,就是用计算的分法找出使组内离差平方和()最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F-分割法”或“有序样品的聚类分析”。第二节 单元有序数据的最优分割若有个有序样品,每个样品只取一个变量,则有个有序数据序列,为 现在试图将这个样品按顺序分割为段,
4、使段(组)内离平差和尽可能小,而组间离差平方和尽可能大。为此,用表示从第个样品数据开始至第个样品数据为止的某段样品,其中 该段样品变量的离差平方和为 (7-4) 式中 由于能够反映样品段内样品间差异的情况,愈小,表示段内各样品之间差异性愈小;反之,愈大,表示段内各样品之间差异性愈大。因此,又把称为段的直径。若个样品分为段: ,为最优段分割。其各段离差平方和(段直径)分别为:,。根据最优分割的原则,其组内离差平方和必须满足 (7-5)或 (7-6)在实际应用时,往往事先不知道个有序样品客观上究竟能划分为几段。因此,必须从最优分成二段、三段、段进行分析。一、最优二段分割若把个有序样品分为两段,则有
5、如下种不同的分法,即 在上述种分法中,究竟哪一种方法最优?只须计算出每一种分割的组内离差平方和,并从其中找出组内离差平方和最小的那一种分割,就是所求的最优二段分割。在个有序样品中,对任意一个都可以确定一个二段分割,即。若把对个样品在第个样品处进行的二段分割的组内离差平方和记为 (7-7)式中,表示被分割的样品数;表示把个样品分为二段;表示以第个样品为分割点。上述种分割的组内离差平方和分别为 在中,当时,则 假设当时,达到最小,即 则最优二段分割为,其中为最优二段分割点。二、最优三段分割若把个有序样品分为三段,其中必有两个分割点。假设第和第个样品为分割点,则三段分割为 若把三段分割的组内离差平方
6、和记为:,其中为两个分割点,则 显然,如果有为最优三段分割,则必为最优二段分割,否则必存在另一个最优二段分割,使 这与为最优三段分割相矛盾。因此,如果对个有序数据进行最优三段分割,必须对任意一个,即前个数据先求出其最优二段分割,为 若 则前个样品的最优二段分割与构成一个三段分割。最后,找出一个适当的,如,使得 则为个样品的最优三段分割,其中和为最优三段分割点。三、最优段分割 若对个有序样品数据进行最优段分割,可先找出个样品的最优段最优分割,即 从而得与构成段分割,但不一定是最优段分割。可选择一个适当的,如时,使得可得最优段分割为,其中为最优段分割点。应当指出,分割的段数一直可做到所要求的段数为
7、止;或者可以预先给定一个小正数,使段分割的组内离差平方和后为止。这样得出的就是最后的分割的段数。由图所示,组内离差平方和是随分段段数的增加而单调地减少。所以当时,组内离差平方和。因此,可根据组内离差平方和随段数增加而下降到比较稳定的时候(即图中曲线平缓时)再确定分段段数。 第三节 多元有序数据的最优分割为了分层,有时需要汇集样品更多的信息,采用多个变量指标。例如,采集个有序样品,每个样品测得个变量,原始数据可构成一个阶矩阵,为 在多变量情况下,人们自然会联想到是否能将单元有序数据最优分割原理引申到多元数据中来,以此对个有序样品进行分割,一般最简单有效的办法就是把一段样品多个变量合并为一个变量来
8、处理,统一定义“段直径”。但是,为了使不同变量间具有共同的数据基础,事先要对各个变量进行数据规范化处理,如使数据作正规化变换。原始数据矩阵中元素记为:,则正规化数据为 (7-8)得正规化数据矩阵 根据正规化数据,将样品段的段直径定义为 (7-9)式中 (7-10)若个有序样品分为段,每段内有个样品,则多元有序数据最优分割的原理与单元有序数据最优分割一样,使组内离差平方和 (7-11)应当指出,样品的段直径除了用式(7-9)定义外,还可用其他方法定义。如用样品数据绝对值距离来定义,即 ( 7-12)也可用其他度量空间的距离来定义。第四节 最优分割法的计算步骤1. 数据正规化 设原始数据阵为 将中
9、的元素变换为 得正规化数据矩阵 2. 计算段直径矩阵 其中 因为 故必须计算个,得 3. 计算全部分割的组内离差平方和(或段直径和)及各种分段的最优分割1) 最优二段分割 由矩阵对每一个计算相应的组内离差平方和,为 找出最小值,确定相应的最优二段分割点,即 分割点为。从而得到个样品的最优二段分割为,其中为最优二段分割点。 2) 最优三段分割 根据矩阵及最优二段分割结果,对每一个计算相应的三段分割的组内离差平方和,为 然后求出最小值,并确定相应的最优三段分割点,为 从而得到个样品的最优三段分割为,其中,为最优三段分割点。3)最优段分割 根据矩阵及最优段分割计算结果,对于每一个分别计算相应的段分割
10、的组内离差平方和,为 找出最小值,并确定相应的最优段分割点,即 从而得到个样品的最优段分割为,其中,为最优段分割点。4. 绘制曲线在曲线上,选择曲线拐点对应的值(取整)作为最终分段数。例71 某煤矿所采煤层的煤质牌号为主焦煤,在煤巷中见一火成岩墙侵入煤层,致使煤质发生变化,为弄清楚煤质变化情况,从火成岩附近每隔m依次取一煤样,获得个有序煤样的镜煤最大反射率数据为 试进行最优分割。此样本最可能分割法共有种,今要在这种分割中找出一种最优的分割(类内差别小,类间差别大)。其作法如下:(1) 对原始数据进行正规化变换后得正规化数据,为 (2) 计算段直径矩阵,即 (3) 最优二段分割。由对于时,计算
11、当时,则 其中 当时,则 其中 当时,则 其中 当时,则 其中 当时,则 从而得到个样品的最优二段分割为。其中,为分割点。(4) 最优三段分割。即对于时,计算 当时,则 其中 分割点为: 。当时,则 其中 其分割点为: 。当时,则 其中 其分割点为: 。 从而得到个样品的最优三段分割为:。(5) 最优四段分割。 即对于时,计算 当时,则 其中 其分割点为:。 当时,则 其中 则分割点为:。 当时,则 即 则分割点为:。故得最优四段分割为:。(6) 最优五段分割。 即对于时,计算 当时,则 其中 故其分割点为:。从而得到个样品的五段最优分割为:。 当时,则 其中 则其分割点为:。由组内离差平方和与分段段数的关系图(图7-2)中看出,三段最优分割时最终分段结果。最优分割法可以用来对地质量进行分段(或分类)。尤其在地层划分、水系中化学成分与水系沉积物化学分带、变质岩相带、蚀变带、矿化带等划分中用的最多。有时对一组没有明显顺序的变量也给予一定的排列顺序进行最优分割。例如把各种煤的镜煤最大平均反射率排序进行最优分割,研究烟煤变质阶段的合理划分等。
链接地址:https://www.31ppt.com/p-1689110.html