灰色过程模式预测的数学原理

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了灰色过程模式预测的数学原理相关的知识,希望对你有一定的参考价值。

参考技术A

所谓过程模式,指的是模式特征是一个多维(随时间变化)的随机向量,而不是一个高维的点。因为研究的对象是地震资料,所以模式数字序列可以看做一个灰色过程或随机过程,其特征也应是一个既反映内在结构,又反映变异特性的动态变化过程。该方法以地震资料为对象,用灰色系统(易德生等,1989)、模糊数学(赵振宇等,1992)、分形理论(J.Pang,et al.,1996;王域辉等,1994)等新理论新方法,来描述储层的内在特征,以灰色识别等新技术,来综合识别裂缝发育有利地段,为进一步布置开发井位服务。

灰色过程识别的算法核心技术是:①由地震资料,通过多种数学生成变换,提取出既能反映模式的内在结构,又能反映模式间差异的多维特征矢量(过程特征),从而全面地,多方位地、动态地刻画出模式的数字特征;②针对多维过程特征的多模式、多方案的灰色过程识别算法理论及其软件设计;③多方案识别结果的人机交互综合技术,以最终获得一个可靠的、符合地质实际的评价结果;④形象直观的图示技术,使其计算结果的宏观趋势及变化状态一目了然,方便、确切地实现计算过程与地质评价解释人员的交流交互。

预测评估是以地震剖面及其变换剖面,如岩性剖面、速度剖面、VSP剖面等数据资料为基础,通过各种方法提取特征参数,用不同的方法进行多参数模式识别,评价目的层的横向变化及含油气的可能性,进而推断含油气区段。

5.1.1 预测评估的基本原则

灰色过程模式识别系统是集地质、地震、数学、计算机、人工智能等多学科知识于一体的综合型智能识别体系,但是,碳酸盐岩古潜山储层是高度非均质性的地质体,因此,无论在模式建立、特征提取或识别推断上都遵循以下四条原则:

(1)变异性原则:在特征提取时,采用时窗滑动的方法,对每一个CDP道可以提取出若干个特征向量,用以描述动态过程特征。

(2)随机性原则:可以将一个地震数据序列看成一个随机变量,同样可以作统计处理、求取子样特征参数,如均值、方差、极差等。该原则恰好与灰色理论的基本观点相符合。

(3)相似类比原则:从地质背景出发,选取适当的评估范围,绝不可太长。针对目的层,其上、下界应根据地震剖面及地质分层等成果进行标定和拾取。

(4)延续性原则:相邻CDP位置间必然存在一定程度的延续成分。

据此,一方面,模式井道的选取可以按照就近原则选取离井位置最近的CDP道,也可以选取相邻的几道组合而构成模式;另一方面,模式识别结果也可以相应地作一定长度内的平滑处理,剔除部分随机干扰。

5.1.2 预测评估的步骤

(1)确定目的层,截取目的层的剖面数据,建立评估算法的基本数据体;

(2)确定模式井道,组构评估模式数据体;

(3)特征提取:特征提取是本方法的第一个研究重点,因为特征提取的好坏将直接影响最终的评估效果。由于原始地震道是一个包括沉积、地层、构造、岩性等多种地质信息的综合响应系统,从中提取能够反映模式间特征差异的信息则是关键。

本方法从动态过程的观点出发,提出了Jacklife统计、灰色参数、模糊自相似从属度、模糊分维、几何分维等多种特征向量提取方法及计算方法。

(4)多参数多方法模式识别:模式识别是本方法的另一个研究重点。特征提取之后,要合理地“分类”和比较,根据各CDP位置数据的量化结果评估储层的变化和油(气)存在的可能性,这是关键性的一步。

5.1.3 地震特征参数的提取

所谓特征提取就是通过数学变换将地震时间序列中能反映储集特征及含油(气)可能性的信息提取出来。由于每个地震道时间序列,实际上是一个随时间而变化的动态过程,因此把它看做一个灰色过程是合理的。因而其特征生成结果,也应是一个随时间而变化的过程,即过程特征更为全面、更为合理。

设有一个地震道的时间序列为X:

储层特征研究与预测

它不仅能清楚地反映层位、构造、断层等地下地质信息,而且还包含了岩性、孔隙度、渗透率等油储特性。显而易见,特征参数提取的关键在于:如何从地震时间序列中提取出能反映储层及含油气性的特征参数。

研究前人有关特征参数提取的方法,可以看出,无论是统计参数,或是自回归系数,甚至分维数,都是对每个时间序列(即一个地震道)求取一个特征值,以代表整个序列的总特征,这种以一个参数代表一个地震道的参数提取方法称为点特征提取法。然而,这种特征参数提取方法有很大的局限性,因为每个地震道都可以看成一个随时间变化的动态随机过程,它不仅具备系统的内在结构特征,而且在不同时间段内又随地层的不同而具备不同程度、不同性质的差异。据此,应该视具体情况,选择相应的时窗长度,在该时窗内进行滑动拾取,针对每个时窗逐次提取特征参数,从而构成一个特征向量。这样,才能全面、细致地反映整个序列的总体特征,我们称之为过程特征。

地震数据体的特征提取一般有三大类,即:基于振幅的统计特征;基于功率谱、自相关、自回归的频率特征;以及基于分维、模糊数学、灰色理论的非线性特征参数。这三类参数可达几十个,但是并非所有的特征参数对所要求解决的地质问题都有效,实践证明,必须要针对不同地区、不同储层和解决不同问题,筛选出有明显反映的特征参数。本次研究的目的是直接预测溶蚀、裂缝带的分布,因此选择了反映振幅变化的统计特征、反映频率变化的自相关特征、反映更复杂组合的非线性特征(如灰色参数、模糊分维数)等19个特征参数向量,亦即:

(1)统计特征的提取

a.绝对均值:

储层特征研究与预测

b.最大峰值:

储层特征研究与预测

c.最大谷值:

储层特征研究与预测

最大峰值、最大谷值分别表示地震序列的最大振幅和最小振幅,它们界定了总体的取值范围。

d.正均值:

储层特征研究与预测

其中n′为地震序列中取值大于0的点数。

e.负均值:

储层特征研究与预测

其中 m′为地震序列中取值小于0的点数;x +、x -反映了地震序列正、负振幅的平均位置。

f.二分之一能量时间:

称为地震波的总能量,则存在一个适当的 t,1< t< n,使得

储层特征研究与预测

则t称地震波的二分之一能量时间。

g.正负样点比:

设 n +为地震序列中取值为正的点数,n -为地震序列中取值为负的点数,则

储层特征研究与预测

称为正负样点比。

h.标准差:

储层特征研究与预测

用于描述时间序列相对平均值位置的离散程度。δ值越小,表明序列的离散程度越小,序列的取值密度越大,各取值点越靠近其平均位置。

i.周波跳跃系数:

储层特征研究与预测

其中:n1代表两个相邻取值xi和xi+1由正到负的突变次数;n2代表两个相邻取值xi和xi+1由负到正的突变次数;(i=1,2,…,n-1)。

a用以描述时间序列的周期变化频率,a越大,则表明时间序列变化频率越高,因此,该特征在地震时间序列中可以反映地层变化的复杂程度。

以上介绍的9种特征参数都是时间序列的总体特征参数,估计出的是一个特征值,它们从不同角度反映了地震序列的变化特征,反映了储层储集性的细微变化。但是,地震时间序列反映的是一个地层随时间而变化的动态过程。而统计特征参数描述的是时间序列的总体特征,并没有体现时间内的细小变化。为此,胡远来教授提出运用拓宽Jacklife统计思路,采用切除任一时间段而统计估算其余部分的特征参数的方法,来提取整个时间序列的特征向量。

下面以均值为例,阐明该方法的计算过程:

a.给定的时窗长度为1<l<n;

b.计算

储层特征研究与预测

c.取i=1,2,…n-1,即让时窗从x1逐步滑动到xn-1,计算出n-1个平均值。这种估算既可满足统计的大样本量要求,又能反映整个数列的动态特征,将更有利于识别类比。

(2)自相关特征的提取

自相关特征即地震反射波的自相关函数的一些特征参数,实践证明,它们对地震反射波的波形微细变化有较敏感的反映,能反映地震记录沿时间方向的重复性状态。设地震波时间序列为 X=x1,x2,…,xn,则 X 的自相关函数r 为:

储层特征研究与预测

自相关函数r不仅是一个随时间而变化的函数,而且是一个振幅随时间增长而衰减的周期函数,其中周期为A0=r(0)为最大峰值,A1、A2、A3分别为三个过零点时间,则可以取得如下6个自相关特征参数:

a.第二峰值与最大峰值比:S1=A1/A0

b.第三峰值与最大峰值比:S2=A2/A0

c.第四峰值与最大峰值比:S3=A3/A0

d.主瓣宽度:S4=2t1

e.二瓣宽度:S5=t2-t1

f.三瓣宽度:S6=t3-t2

(3)灰色特征的提取

基本思路是:将地震时间序列看做一个本征灰色系统,从而建立起系统的灰色模型,然后从模式识别的目的出发,通过数学变换,组构一个能够最大限度地反映模式之间差异的灰色特征向量。

该方法的目的在于:通过预测模型 GM(1,1)的建立,确定辨识参数-a 和-u。在灰色理论中,称-a 为发展系数,-u/-a 为调节项。两者刻画了模型的系统结构,反映了系统的总体变化趋势,进而,可以用来描述储层特征模式,或含油气与否的地震道序列,继而从模式识别的角度出发,使得总体特征对于不同的模式而言,表现出来的差异应越大越好;对于相同或相似的模式而言,表现出来的差异应越大越好;对-a、-u 进行组合构造,提取灰色特征。

研究发现-a 数值虽小,但较灵敏,序列的微小变化则会引起-a 的剧烈波动;而调节项-u/-a 的变化则比较平缓。

为此,针对-a 和-u 提出灰色特征向量的构造方法如下:

设有地震时间序列 X=(x1,x2,x3,…,xn),确定特征提取的滑动时窗长度 1,1≪n,对于任意一个滑动时窗 i(i=1,2,…,n-l);

a.求取时窗 i 下的GM(1,1)的辨识参数-ai和-ui

b.将两者作规一化处理,使之成为[0,1]之间的灰数;

c.构造 ai=f(-ai,-ui),使得 ai∈[0,1];

则有ai(a1,a2,…,an-1),称ai为灰色特征向量。

(4)模糊特征的提取

模糊特征是指由分维特征拓广引申出来的模糊分维及模糊自相似从属度特征。分维是分形特征的一个定量描述参数,是刻画复杂的、不规则几何图形的一个有力工具。可以提取三种特征参数。

a.关联维数

关联维数

储层特征研究与预测

其中

储层特征研究与预测

是相空间中s、t两点之间的距离dst小于r的概率;r为指定距离的上限;H为一个Heaviside函数,即

储层特征研究与预测

b.模糊分维

模糊分维是分维的一种拓广。几何分维认为一个复杂图形的整体与部分之间存在自相似性,而模糊分维(以下简记 F-分维)则认为自相似不一定存在,只存在模糊自相似,是指许多复杂结构,实际上只是某种程度上的自相似,这种现象可以用一个模糊集来表示,从这种观点出发计算的分维数称 F-分维。

若定义相似程度(隶属度)为ust则C(r)可修正为

储层特征研究与预测

c.模糊自相似从属度

冯德益教授从模糊数学的观点出发,采用模糊分维的定义思路,给出了模糊自相似从属度的概念。若原标度为1,新标度Lj,则称rj=1/Lj为模糊自相似比。倘若在自相似比rj下,第i个图像与原图像的相似度为ui,则整个结构的模糊自相似从属度(以下简称F—自相似从属度)可定义为:

储层特征研究与预测

式中;na为相似性测定的次数;n 为选取的 F-自相似个数。

我们研究分维、F-分维、F-自相似从属度是用于提取地震资料表征的储层特征和含油气特征。由于一个地震序列反映的是若干米厚的地下地质体的数字特征,所反映的地下地质信息十分丰富,其中包括了若干厚薄不一的储层和非储层。一个储层中又可能包含了数个更小的岩层,因此若把若干米厚的地城序列曲线看做复杂图形的集合体,分析其分维、F-分维、F-自相似从属度特征,这就太粗了,不能反映细层的差异。我们认为应取一定厚度的曲线作为整体(这个厚度称为逻辑尺或逻辑时窗 Q),用上述公式计算三个参数,然后滑动时窗,再计算三个参数,如此继续下去,就可以得到三条特征曲线,它能动态地、全面地反映储层的内在规律性,实现储层的分类识别。

另外,因为地震序列从上到下的变化与地下地质的变化特征是密切相关的,因此,在这里应把它看作一个有序的灰色自相似结构来计算。

5.1.4 灰色模式识别

5.1.4.1 灰色关联识别

灰色模式识别是将一个模式X看做一个灰色过程,其数字特征是一个灰数序列:

储层特征研究与预测

那么,标准模式i:

储层特征研究与预测

与待评估模式j:

储层特征研究与预测

之间的相似性度量则用灰关联rij来表征。倘若已知标准模式Xi,i=1,2,…,m,与未知待辨识模式Xj的灰关联度为rij时,则其识别准则如下:

储层特征研究与预测

则模式应划归第K类。

灰关联强调的是系统过程的动态发展变化,它是根据模式特征因素间发展变化趋势的相似或相异来衡量模式间的相似程度。这种系统分析方法对样本量大小没有特殊的要求,也不像统计识别那样需要以某种统计分布为前提,因此,适用范围广。

5.1.4.2 灰关联度

灰关联度计算是灰色模式识别的关键之一。关联度是度量待识别模式(向量)曲线(Xj)与标准模式曲线(Xi,i=1,2,…,m)的相似程度的一个定量值,其定义可以有多种,现采用四种。

a.经典关联度

其定义如下:

储层特征研究与预测

式中:

储层特征研究与预测

0≤a≤1称为分辨系数,越小分辨率越高,一般取a=0.5,显然0≤rij≤1;rij越大,表明j模式与i模式的相似程度越高,其几何意义是两条曲线越相似。

b.模糊关联度

为了顺应模式变化,增强系统的适应能力,引入了模糊数学的观点,不难看出:“灰”与“模糊”只是“不确定”的两种形式。

这里选用模糊算子:极大∨和极小∧,便得出模糊关联度,记作fij

设:

储层特征研究与预测

则有:

储层特征研究与预测

这样一来模糊关联度的灵敏度较之经典灵敏度降低了,也就是说,反映模式间变化的灵敏度降低了,相似性度量有一定的模糊性。

c.组合关联度

经典关联度着重描述模式曲线间的几何形态,即变化趋势越接近,关联度值越大。但针对某些过程(如地震道时间序列),不仅要考虑它的位置变化,而且还应考虑其变化速率、速度差和加速度差。由此,该方法引入了一种新的关联度—组合关联度,记作Zij

设:

储层特征研究与预测

则有:

储层特征研究与预测

组合关联度是灰模式(曲线)变化过程中的位移差、速度差和加速度差的合成,增强了模式形态外变差的相似性,将更有利于模式对比。

d.距离关联度

在经典关联度的计算中,使用了全局最小、最大作规一化处理,使其结果在0到1之间,在多模式情况下,rij不能满足对称性,因此不可以用于模式的聚类分析。然而,在建模之前,又往往需要模式的聚类分析。那么,为了给建模提供依据,便引入了距离关联度的概念。

储层特征研究与预测

其中:d0是一个适当选取的常量,但要满足

储层特征研究与预测

5.1.4.3 初始化变换

在关联分析中,如果变量列间的量纲不统一,则计算出的关联度难以正确地反映变量列间的过程变化特征,使解失真。因此,往往要对变量列(即原始数据列)先进行初始化变换,消除量纲影响,使各变量处于相同地位,具有等效性。

初始化变换有很多种,本系统采取的是初值化,极大化,极小化,区间化或不变换等五种。

若设变换前的原始数到 X=x(1),x(2),…,x(n),变换后的结果数列为 Y=y(1),y(2),…,y(n),则五种变换算法公式为:

① 初值化变换

储层特征研究与预测

②极大化变换

储层特征研究与预测

其中

储层特征研究与预测

③极小化变换

储层特征研究与预测

其中

储层特征研究与预测

④区间化变换

储层特征研究与预测

⑤不变换

储层特征研究与预测

显然(1)~(4)种变换都是无量纲化变换方法,否认原始数列的单位是什么,变换后都消除了单位大小的影响,特别是区间化变换,不但消除了量纲,而且使各变量列的数量级都统一在0到1之间。

5.1.4.4 灰色模式识别策略

该系统针对每个地震道提取19个特征向量,从灰色理论的基本观点出发,将每一个特征向量看成该模式的一个灰色序列,从而构成一个多参数序列的灰色模式识别系统,其基本策略是:

(1)以四种关联度构成一个多参数的自动优化识别系统。自动优化指的是:系统通过试算,在确定的优选目标下,选取最适合本问题的方案,来计算推断整个地震剖面的储层裂缝的发育概率;

(2)通过学习训练,求取多参数序列在模式识别中的贡献,由各参数的贡献大小,来适当组构识别的数学模式,用于全剖面各道的外推识别。

(3)由于每一类都可能存在多个已知模式(井旁道),因此,模式的建立可以采取两种策略:或者针对每一类选取一个有代表性的、具有普遍意义的模式井道作为模型,称为单井模式;或者根据每一类中各模式道的微小差异,取其加权平均作为模型,称为组合模式。

5.1.4.5 灰色模式识别结果

(1)灰色过程识别的多方案设计

由于模式的相似性度量是一个多维灰关联系数,根据灰关联理论,我们可以将原始输入序列作不同的初始化变换和采用不同的灰关联定义。因此,在实际计算时,就可以设计多种不同的计算方案,以求从多角度、多对比技术方面获取更有效的结果。

本算法可以选取4种不同的初始化变换、4种不同的灰关联定义,即可以有4×4=16种算法方案。为便于使用掌握,本算法软件,设计出了一个自动优选机制,自动优选出最优的前三种方案作数字模型及外推识别计算。

优选的原则是分辨率高,回判及检测效果好。

(2)多结果的综合技术

对任一测线剖面,都可以获得几个计算结果,如何综合选择,求得最终结果,这是十分重要的。一个好的结果应是:

①回判及检测的正确率应当高;

②横向的连续性应当好,因为地质体尽管是非均质的,各向异性的,但在一个小范围内,在宏观上应该有一定的延续性。

③不只看单测线结果,还应看区域结果,从区域构造,区域地质背景来检验结果。因此,这就需要与评价解释人员进行交流,实施交互选择。

通过反复计算,反复交互,最终才能获得满意结果。决不能把它看成一个单纯的计算问题,它是一个数学与地质紧密结合的,系统的,科学的研究问题。

(3)图示技术

为了使输出结果形象、直观,特别是使结果的交互选择能快速、顺利地实现,该算法设计出了测线时间剖面图及平面预测结果图,可以一目了然地,观察整个测线的结果变化状态、储层走势,模式井位置,及预测分类级别等。

    官方服务
      官方网站

数学建模笔记——评价类模型之灰色关联分析

参考技术A 这一篇就简单介绍一下灰色关联分析吧。灰色关联分析主要有两个作用,一是进行系统分析,判断影响系统发展的因素的重要性。第二个作用就是用于综合评价问题,给出研究对象或者方案的优劣排名。

不过这里我只能简单介绍一下,更加深入的原理,可能需要我专门学习之后才能清楚地表达出来。不过应用起来倒不是很难,部分原理理解不清晰应该也不影响使用,就当作了解一个新方法吧。

事实上越往后学,例如多元回归分析、运筹学相关、时间序列分析、各类预测模型、聚类分类等等,都涉及到很多有难度的数学推导。我自己即使有所理解和学习,但想要比较简单易懂地表达出来,还是需要更长时间沉淀的。所以目前写学习笔记,就只能简单说明一下原理,然后讲一下傻瓜式应用了。等我理解得更加深入了,再回头把写得不够深入清晰的文章翻新一下吧。

好的,言归正传,讲一讲灰色关联分析吧~

“在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。”

以上内容摘自百度,大概就是这么回事。灰色关联分析的研究对象往往是一个系统。系统的发展会受到多个因素的影响。我们常常想知道,在众多的影响因素中,哪些是主要因素,哪些是次要因素;哪些因素影响大,哪些因素影响小;哪些具有促进作用,哪些具有抑制作用等等。

数理统计中常常使用回归分析、方差分析、主成分分析等来探究这个问题。但上述的方法有一些共同的不足之处。例如这些方法都要求大量的数据,数据小则结果没有太大意义;有时候还会要求样本服从某个特殊分布,或者出现量化结果与定性分析不符合的情况。而灰色关联分析则可以较好地应对这种问题。

灰色关联分析对样本量的多少和样本有无规律并没有要求(当然样本量也不能太少,就两、三个样本还分析什么),量化结果基本上与定性分析相符合。灰色关联分析的基本思想是,根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线形状越接近,相应序列之间的关联度就越大,反之就越小。

嗯,对于上述原理,简单翻译一下,就是研究两个或多个序列(序列可以理解为系统中的因素或者指标)构成的曲线的几何相似程度。越相似,越说明他们的变化具有某种紧密的联系,也就是关联度高。所以这个方法也几乎是从纯数据的角度去研究关联性,如果两个没啥关系的指标,在曲线形状上表现得极为相似,那灰色关联分析就会认为二者关联程度很高。当然这只是一个比较极端的例子,对于一般的数据或者系统,用曲线形状来衡量关联度,也是有一定的道理的。

我们首先来介绍一下第一个应用,也是它的基本应用,系统分析。其分析的主要内容,就是给“影响系统发展的各因素”在重要程度或者说影响程度方面排序。用灰色关联分析的说法,就是给出各个因素与系统总体的关联度排序。关联度越高,说明相应因素对系统发展的影响越大。至于关联度,就是上文提到的曲线形状的近似程度了。嗯,其实模模糊糊还是可以理解灰色关联分析的,就是感觉上有一点儿不靠谱hhh

下面直接举个例子来讲解应用灰色关联分析的方法。(原理已经讲过了呀)

下表为某一地区国内生产总值的统计数据(单位:百万元),问该地区从2000年到2005年之间哪一种产业对GDP总量影响最大。

诺,这就是一个典型的系统分析问题,找出对GDP发展影响最大的一个因素。那我们需要怎么做呢?想想看,灰色关联分析的原理是,比较序列曲线几何形状的相似性,那当然要先把序列曲线给画出来呀。嗯,第一步就是画出序列曲线啦。

这里需要注意,我们想要研究各因素对系统总体的关联度,就需要找出一个可以代表系统总体发展的指标,这里就是GDP。类似的,我们想要反映教育发达程度,就可以使用国民平均接受教育的年数来代表;我们想要反映社会治安面貌,就可以使用刑事案件的发生率来表达;想要反映国民健康水平,就可以使用医院挂号次数来表达。不管怎样,总是需要找到一个指标,对系统整体的发展进行刻画。

别的不说,只看曲线形状,我就觉得第一产业对GDP的影响最小了。GDP一直往高处走,而第一产业曲线的形状几乎就是平着的。而单看相似性,好像第二产业,也就是灰色曲线与GDP曲线最为相似。不过画出图像只是为了给出一个直观的感受和分析,曲线形状的近似程度,还是需要计算的。

第二步是确定分析序列。分析序列分为两类,一类称之为母序列,也就是反映系统整体行为特征或发展的数据序列,可以理解为回归分析中的因变量,这里就是GDP这一列。另一类称之为子序列,也就是影响系统发展的因素组成的数据序列,可以理解为回归分析中的自变量,这里就分别是第一产业,第二产业,第三产业的生产总值数据。

第三步是对数据进行预处理。预处理我们讲到许多了,例如正向化,标准化,归一化等等。这里预处理的目的就是去除量纲的影响,以及缩小数据范围方便计算。数据标准化往往就是这个作用。数据标准化有多种方法,例如 标准化,就是原数据减去均值除以方差,随机变量往往使用这种方法;再比如 标准化,就是 。这两个方法之前都提到过。

那在这里,我们使用的标准化方法是每一个元素除以对应指标的均值,也就是 。嗯,我们展示一下处理之后的数据。用excel处理就可以了,比较方便。

第四步,计算处理后的子序列中各个元素与母序列相应元素的关联程度。记母序列为 ,子序列为 , , 。我们首先计算出母子序列最小差 ,之后再计算一下母子序列最大差 。计算如下表。

嗯,可以发现, 就是上表中最小的元素, 就是上表最大的元素。然后我们就可以计算子序列中每个元素与母序列相应元素的关联度啦。

灰色关联分析中,定义 ,其中 是分辨系数,一般位于 之间,往往取 。至于为什么要用这样一个公式定义子序列某元素与母序列相应元素的关联度呢?我就不晓得了……嗯,自行查阅,如果知道了请留言告诉我,谢谢!

第五步,计算各个序列,也就是指标与系统总体的关联程度。我们定义 ,用它来表达某个指标与系统总体发展的关联度。

嗯,其实就是第四步,求出了指标内部各个元素与母序列对应元素的关联度,把他们求个平均值,就可以看作该指标与系统总体的关联度了。如果你可以接受上文中的关联度计算公式,想来接受这个关联度均值,应该不是太难。

上图就是该题的最终计算结果了,计算证明,取分辨系数为0.5时,第三产业对国内生产总值的影响最大。好像跟那个图片不是很符合……毕竟从图片上直观感受,应该是第二产业的曲线形状与GDP的曲线形状最为相近,结果计算出的是第三产业。那,我们换一下 试试。

一番操作,还是第三产业对GDP影响最大。不过再次提醒,实际使用时, 是最常用的。

如果要强行解释一波,大概就是GDP的增长率是有起伏的,2002-2005之间每一段折线的斜率是不同的,而第二产业2002-2005之间,基本是一条直线过去,相比之下,第三产业的增长变化,更像GDP的变化……好吧就是强行解释一下啦

上图是每一年的增量情况……嗯,好像也是灰色和蓝色更像,不过2003-2005的增量,也就是2002-2005这四年来看,第三产业和GDP的增长更加相似。而第二产业只有一两年比较相似,所以综合来看,可能还是第三产业对GDP的影响更大吧。

嗯,强行解释完毕。

最后对于系统分析问题,还有两个问题。

嗯,系统分析讲到这里。

灰色关联分析用于综合评价的核心是,通过指标的关联度确定每个指标的权重,之后加权求和打分。

还是这二十条河流。评价水质,我们用灰色关联分析怎么做呢?

第一步、把所有指标进行正向化处理。正向化处理知道是什么吧,就是把极小型,中间型,区间型指标,全部转化为极大型指标。也就是要求数据值越大,最后得分越高。

第二步、对正向化的矩阵进行标准化。这里的标准化跟上面系统分析的标准化是一个东西。也就是用每一个元素除以对应指标的均值, ,把数据的范围缩小,消除量纲影响。将经过了上述两步处理的矩阵记为

第三步、将正向化、预处理之后的矩阵,每一行取出一个最大值,作为母序列。嗯,这里就是灰色关联分析用于综合评价问题需要注意的点了,也就是人为的构造出这么一个母序列。

第四步、按之前提到的方法,计算各个指标与母序列的灰色关联度,记为 。

第五步、计算各个指标的权重。每个指标的权重 。也就是关联度占总体关联度之和的比重。

第六步、我们求出每个评价对象的得分。对于第 个评价对象,其得分 。这里的 ,也就是上面提到的经过正向化和标准化的矩阵 。 中的每一个指标都是极大型指标,数值越大分数应该越高,同时消除了量纲的影响。因此我们直接把 中的元素作为每个指标下对每个评价对象的打分,然后对指标的分数进行加权求和。权重就是我们上面使用灰色关联度求得的权重。这样子,我们就求出了最终的分数。

第七步、对分数进行归一化处理。 ,这样子可以把分数全部放在0-1之间。归一化的好处就是,此时的分数可以解释成相应的研究对象在总体研究对象中“水某平”的百分比,也就是所处的位置。在水质题目中,也就是某河流水质情况在所有河流中所处的位置。嗯,用一个更通俗的说法,就类似于“您的成绩超越了百分之xx的同学”。这就是归一化的目的。

下图展示了对于水质情况的评价,使用TOPSIS方法与灰色关联分析的结果。

可以看到,这两种方法对于该问题最后的排序是不同的。第一名的取法就不一样,中间一部分顺序也比较不同,不过总体上还是比较相近的。hhh,不如再使用一个层次分析法,把三种方法得出的归一化后的分数,再取个平均,作为最终排序的依据。嗯,你看这个模型,是不是一下子就复杂了。

好的,本文就到这里,其实还是有几个迷惑的问题没有解决。

后两个好像可以强行解释,因为我们把正向化以及标准化后的矩阵当成分数矩阵了,所以取每一行的最大值,用来构造系统的最优得分序列,每一项方案就相当于系统的一次发展。之后计算关联度,就是看指标对系统最优序列的影响程度,影响程度越大,我们就赋给它更大的权重……嗯,强行解释

上面这三个问题,如果谁有比较好的想法,希望可以留个言告诉我,现在这里谢过!如果我以后慢慢理解了,也会在文章中更新。(不过发在微信公众号上可能是无法更新了,知乎和都可以)

灰色关联分析,我能分享的也就这么多了。如果想要继续了解,可以阅读《灰色系统理论及其应用》,刘思峰等著。嗯,灰色系统还有灰色系统预测,灰色组合模型,灰色决策,灰色聚类评估等应用,没事儿可以看看。

这两天知乎给我推送了一些数学建模相关的问答,其中一个是数学建模相关书籍。我把高赞回答推荐的书的电子版找了一下,如果需要的话,在微信公众号“我是陈小白”后台回复“数学建模书籍”即可。

以上

以上是关于灰色过程模式预测的数学原理的主要内容,如果未能解决你的问题,请参考以下文章

数学建模笔记——评价类模型之灰色关联分析

Task1:动手学高等数学(sympy、scipy、matplotlib)

数学建模灰色预测模型 -- 学习笔记

数学建模灰色预测程序代码?

Matlab数学建模灰色预测模型

Matlab数学建模灰色预测模型