信息论方法在水资源系统工程中的应用

时间:2022-05-29 12:05:55

信息论方法在水资源系统工程中的应用

摘要 水资源系统工程是水资源科学与系统科学相互交叉形成的一门新兴综合性工程技术学科,在人口、资源、环境、经济与社会区域可持续发展战略研究中具有重要意义,其中的一个重要研究问题是如何有效挖掘实际水资源复杂系统中各种不确定性信息。为此,在阐述信息论基本概念和主要方法的基础上,对信息论方法在水资源系统工程中的应用研究按照水资源系统工程的理论框架进行了划分,详细论述了近年来信息论在水资源系统建模、优化、模拟、预测、评价、决策中的应用,探讨了信息论方法用于水资源系统工程中存在的问题和相应对策,展望了信息论方法在水资源系统工程中的应用前景,指出了建设基于信息论的水信息学学科的必要性。这些信息论方法在资源系统工程、环境系统工程和管理系统工程等应用系统工程研究中具有一定参考应用价值。

关键词 水资源系统工程;复杂系统;不确定性;信息论;熵;水信息学

中图分类号 TV213.4;O236

文献标识码 A

文章编号 1002-2104(2007)02-0079-05[FK)][FK)]

信息论一般指的是Shannon信息论,主要研究消息的信息量、消息的传输以及编码问题。1948年C.E.Shannon为解决通信工程中不确定性信息的编码和传输问题创立信息论,提出信息的统计定义和信息熵、互信息概念,解决了信息的不确定性度量问题,并在此基础上对信息论的一系列理论和方法进行了严格的推导和证明,使以信息论为基础的通信工程获得了巨大的发展。此后,以不确定性信息为研究对象的信息论理论和方法在众多领域得到了广泛应用,并取得许多重要的研究成果。例如,由于水资源系统在其发生、发展、演变过程中受到自然因素、生态环境因素和社会经济因素等众多因素的综合作用,使得系统中存在着随机性信息、模糊性信息、灰色性信息、混沌性信息、错误信息和主观信息等大量的不确定信息。这些信息和通信信息具有相同的不确定性特征,因而可以用信息论方法来处理。近20多年来,国内外许多学者在应用信息论概念和方法解决水资源系统问题中作了大量工作,并取得了丰硕的研究成果。本文旨在论述近年来信息论方法在水资源系统工程应用中取得的研究成果,指出应用中存在的难点和问题,并展望了信息论方法在水科学中的应用前景。

1 信息论的基本方法

1.1 Shannon熵和最大熵原理

熵最早是由R.Clausius于1865年引入热力学中的一个物理概念,通常称之为热力学熵。后来L.Boltzmann赋予熵统计意义上的解释,称之为统计热力学熵。Shannon创立信息论后,熵的概念有了新的解释,现在一般称之为信息熵或Shannon熵。Shannon将随机变量X的熵定义为:

1957年E.T.Jaynes在Shannon熵的基础上提出求解非适定问题的最大熵原理,认为:在只掌握部分信息的情况下要对分布做出推断时,应该取符合约束条件且熵值取最大的概率分布,熵值最大意味着认为添加的约束和假设最少,这时求出的分布是最自然、偏差最小。例如利用POME估计X的分布时有:

1.2 互信息和互信息方法

互信息是Shannon引入的第二个概念,对于两个随机变量X和Y,当Y未知时X的不确定度为H(X),已知Y时X的不确定度为H(X|Y),Shannon将随机变量X和Y之间的互信息定义为H(X)-H(X|Y),用I(X;Y)表示,即

1.3 鉴别信息和最小鉴别信息原理

鉴别信息(又称为交叉熵、相对熵、方向散度等)最早由S.K.Kullback于1959年提出,它是两种概率分布之间差异性的量度。20世纪70年代末在J.E.Shore和R.W.Johnson的推动下,鉴别信息得到了很大的应用,并成为现代信息论中重要且不可割的一部分。Kullback将鉴别信息定义为:

这就是Kullback提出的最小鉴别信息原理。该原理说明在满足式(3)和式(4)的q(x)中,使式(7)最小的q(x)意味着由p(x)改变为q(x)所需要的信息量最小。显然最小鉴别信息原理是最大熵原理的推广。利用这两个原理处理水科学的非适定问题、非线性非正态不确定性问题,除了利用约束条件和先验概率分布所提供的信息外,没有增加其它我们实际上没有获得的信息,因此所得到的结果将是客观和合理的。

Shannon熵、互信息、鉴别信息都具有类似的函数性质。在这些性质中,凸函数性质使得三者都特别适合作为优化问题中的目标函数,这同时也为信息论概念和方法在除通信领域以外的其它领域内的应用提供了理论基础,拓宽了信息论的应用范围。

2 信息论方法在水资源系统工程中的应用

2.1 在水资源系统建模中的应用

水资源系统建模主要解决实际水系统与模型之间的关系问题。由于水资源系统中大量不确定性信息的存在,实际问题的约束条件常常不足以导出各变量之间的数学关系,用信息论的概念和方法正好能适合这种场合。用基于信息理论的新方法建立模型既为水资源系统建模提供了一种新思路,也在一定程度上弥补了传统确定性建模方法的不足。

水资源系统工程中应用信息论方法建模最早的便是水文随机现象概率分布模型。1972年,J.O.Sonuga 首次在水文频率分析中应用POME方法建模,利用均值和标准差作为先验信息推导了基于有限数据的小偏差正态分布模型,并于1976年定义了针对降雨―径流过程的条件熵,推导出径流对降雨的条件分布。1991年,N.C.Lind和H.P.Hong应用最小交互熵原理在已知部分约束条件的情况下,利用推导出的概念分布建立了极端水文条件下海水水位分析模型。同年,P.W.Jowitt将熵与流域动力学机制联系在一起,利用产流机制和流域平衡方程建立了以概率分布表示的流域模型,并用POME推导了不同流域内贮水量的概率分布。2000年,张继国和刘新仁在研究了信息的有向传输问题的基础上建立了信息传输函数模型,使降雨的空间分布不均匀性得到了进一步刻划。陆菊春、郑君君等建立了基于灰关联理论的供需协调分析模型,为区域水资源供需协调分析提供了新的方法。2002年,丁晶、王文圣等利用互信息方法,提出广义相关系数Rg,并用三种不同的Rg计算方法研究了金沙江屏山站日径流量序列的相关性。畅建霞和黄强等把熵和灰关联度结合起来,应用耗散结构理论和灰色系统理论,以水资源量作为序参量,建立了基于灰关联熵的水资源系统演化方向的判别模型,并将该模型应用于黄河流域水资源系统的演化评价,为实施临界调控提供了依据。

2.2 在水资源系统优化中的应用

水资源系统优化即通过各种优化方法在有限的水资源条件下,通过系统内部各变量之间、各变量与子系统之间、各子系统之间、系统与环境之间的组合与协调,最大限度地满足生产、生活、生态等各用水部门间的可持续利用要求,使水资源系统具有最佳的政治社会经济效益和生态环境效益。

1989年,T.Husain 在水文站网网络的研究中,应用熵的概念估计了区域水文不确定性和流域信息,对水文测站数量和空间位置进行了优化设计。1990年K.Awumah、I.Goulter等提出配水管网可靠度和冗余度的熵度量,研究了熵概念在水分配系统优化问题中的应用,稍后他们基于Shannon概念又提出了一种度量配水管网规划中的固有冗余度问题,使得水分配系统的优化更加深入。1997年,徐祖信、刘遂庆等采用与可靠度对比的方法,讨论了由Awumah等提出的熵概念在水分配系统优化设计中的应用,提出了一个改进的熵计算公式并将其用于水分配系统的优化设计中,从而大大减少了大型水分配系统优化设计的时间。2000年,汤瑞凉、郭存芝等针对灌溉水资源的优化调配问题,应用熵权系数法的基本原理,综合考虑农业可持续发展的经济效益、社会需要和生态效益要求,提出了对方案进行多准则综合评价的熵权系数优化模型,以确定农业最优种植模式及相应的灌溉水量。2001年,陈植华介绍了基于信息熵原理研究观测网优化设计的方法,包括基本概念、原理和解决观测孔层次分类、信息冗余以及空间优化布局的技术思想,并认为,信息熵方法是一种能够评价地下水观测网信息收集能力和优化观测网布局的很具发展潜力的技术方法。2004年,陈军飞研究了调水工程线路方案的优选问题,并将层次分析法和信息熵法结合起来建立了调水工程线路方案优选的灰色系统模型,为解决区域水资源分布不均衡性找到了一条新的途径。

2.3 在水资源系统模拟中的应用

水资源系统模拟就是在计算机上用建立的各种模型来模仿和仿效所研究的实际系统,并利用模型的数值求解来检验模型的有效性、推断系统的行为特征和结构特征,或用于解决系统预测和决策等问题。由于水资源系统的高度复杂性和各种数据信息的不确定性,许多问题很难用解析方法准确求解,这时系统模拟方法显得尤为重要。

1988年C-L.Chiu应用POME推导了明渠断面上二维流速分布方程,该方程能描述纵向最大流速发生在水面或水下时的垂向和横向流速变化情况。1996年,A.D.Woodbury和T.J.Ulrych对一维恒定速度弥漫系统,由已知污染物的排放形成的羽状形态利用最小相对熵方法进行了模拟,重演了其演变过程。2002年邓家泉建立了满足熵原理的二维明渠非恒定水流的BGK数值模型,并能准确模拟存在不连续运动的明渠水流运动。2004年畅建霞、黄强等将模拟方法与协同学理论相结合,建立了有序度和有序熵,并通过这两个参数对黄河流域水库群的调控进行了研究。同年魏林宏、郝振纯等引用信息熵对不同分辩率DEM的信息量进行分析并对影响水文模拟的两个重要参数―径流路径和汇流平均坡度对DEM的敏感性进行了评价,在同一组模型参数下对DEM分辩率变化对径流模拟的影响进行了分析研究。

2.4 在水资源系统预测中的应用

水资源系统预测主要指的是在充分掌握各种实际数据和历史资料信息的基础上,运用一定的科学原理和方法,对系统在未来一定时期内的可能变化进行推测、估计、分析和评价,以减少对系统未来状况认识的不确定性。1967年J.P.Burg首次提出将信息论中的最大熵原理与传统谱估计法相结合的最大熵谱分析方法(Maximum Entropy Spectral Analysis,MESA)。1983年,R F.Elibert和R A.Christensen将MESA应用于美国加州中部的年水量序列分析,对干旱进行了长期预测。1989年N.R.Dalezios和P.A.Tyraskis将Burg方法进行了推广,建立了相应的线性预测模型,用以分析和预测区域降水时间序列。1993年P.F.Krstanovic和V.P.Singh 在研究了多元随机洪水预报,前向、后向以及插补预报模型的基础上,运用MESA建立了实时洪水预报模型,该模型具有很大的推广性。1994年,A.Kusmulyono和I.Goulter基于POME提出一种对不连续监测站点进行水质预测的新方法,可以根据下游测站水质测量值的变化对上游水质进行无偏估计,验证试验表明该法预测的适用性,而且可以识别造成下游水质发生观测变化的污染源排放点。他们于1995年又研究了在不连续的站点预报水质等级时应用POME的计算效应问题。1996年李星敏利用陕西省汛期7个代表站的近40年降水量资料,采用移动样本序列的极大熵谱法研究了它们的周期性,结果表明当地汛期降水存在明显的准周期,并具有良好的稳定性和持续性。1998年张素欣、王吉易等利用最大熵谱方法对河北省及邻区几个井孔的地下水动态多年观测资料进行了熵谱分析,加深了对地下水动态变化周期的认识。同年,王蕾、巴特尔等应用功谱密度函数最大熵法,利用兰州1944-1997年的月平均降水资料建立了线性平稳序列的降水预测模型,对1986-1997年11年的月降水预测试验表明该模型具有一定的预报能力,并认为模型阶数取15阶预报效果较好。2001年,顾骏强、徐集云等利用MESA和EOF(Empirical orthogonal function)方法对浙江夏季降水变化过程、变化特征、准周期振荡、突变等进行了分析,在研究了夏季旱涝与北太平洋海温异常变化的关系后,认为可以通过海温的异常变化来预测旱涝发生的时段。2002年刘学锋、赵黎明等通过最大熵谱方法对京津冀区春夏季降水的气候变化进行了研究,得出了各降水型的主要变化特征及主要周期。同年,王栋和朱元生利用建立在最大熵原理基础上的谱分析方法对黄河花园口秦厂测站年径流系列、月径流系列和年最大洪峰流量序列的隐含周期特性进行了分析。2004年,鱼京善、王国强和刘昌明将确定降水周期的最大熵谱分析程序模型集成于GIS二次开发系统中,实现了降水预测分析结果与地理空间数据的结合。

2.5 在水资源系统评价中的应用

水资源系统评价就是对所研究的水资源系统内各评价对象在总体上进行的分类排序,是一个把多指标综合成单指标,再根据该综合评价指标对评价对象进行分类排序的过程。其中评价模型的建立是水资源评价的核心工作。近来以基于信息论的评价方法也有较多的应用。

1973年I.Morocho和B.Espildora首次利用边缘熵和条件熵推导出传递信息判据,可以作为水文系统模型评估的依据。1997年王梅、王恒栋和周之豪结合Delph、层次分析法等,提出基于熵的指标权重确定方法,并据此对水利建设项目进行了灰色系统评价,为水利建设项目综合评价提供了新的途径。1998年张成科在综合考虑水质评价中存在的模糊性与随机性的基础上,根据最大熵原理提出水质模糊评价模型,数值例子表明新模型在水质评价中的有效性和可靠性。同年胡明星、郭玲香等提出了基于误差平方和准则和模糊熵准则下的多准则神经网络湖泊水质营养化评价模型,并将其应用于我国五大湖泊水质营养化的评价,结果表明该模型简便、实用、客观、通用性强。2001年路振广等将信息熵理论与模糊决策联系起来构建了一个系统模糊优选熵权模型,用于节水灌溉工程项目综合评价中,应用效果表明模型适用于任何结构性、半结构性或非结构性多目标多层次大型复杂系统的综合评价,具有广泛的应用前景。他们在2002年又应用构建的评价模型对低压管道输水改进的畦灌、微喷带灌、移动式喷灌、半固定式喷灌和固定式喷灌5种节水灌溉工程技术形式进行了综合评价。2002年,林运东、门宝辉等根据水质营养类型各评价指标特征值之间的变异程度,利用熵权系数确定各评价指标的权重,并将该方法应用于浑江水库的营养类型评价中,取得了与模糊综合评价法相同的结果。赵庆良等应用POME建立水质模糊综合评价模型,并对开封市惠济河水质进行了综合评价。王栋等基于POME在综合考虑水环境评价的随机性和模糊性的基础上建立了两个水环境相对隶属度模糊优化评价模型,实例结果显示两模型评价结果相一致,且具有较小的Shannon熵(评价模型不确定性小)。他们在2004年又将集对分析和模糊集合论引入水环境评价中,并定义了广义联系熵和广义相对隶属度,分别建立了水质营养评价的一级模型和二级模型,对我国12个有代表性的湖泊营养化程度评价的应用实例显示所建模型的有效性和简便性。2002年陈植华提出基于信息熵理论的地下水观测管网分类方法,认为地下水观测网就是一种信号通讯网,水位信号具有可传递性、差异性以及衰减性的特征,可以运用互信息概念定量刻画观测孔之间的信息联系,以这种信息联系程度作为观测孔层次分类的主要依据,并用河北平原地下水观测管网分类实例,验证了信息熵方法解决此类问题的有效性。2003年韩宇平等采用熵值法给水安全评价各评价指标赋权,并利用多层次多目标决策和模糊优选理论建立了区域水安全评价的模糊优选模型,对我国部分省级行政区的水安全状况进行了评价,取得了与各地区的水资源实际状况相吻合的评价结果。2004年姜志群、朱元生认为基于POME的水资源模糊综合评价模型能充分利用系统信息,考虑评价标准和评价指标的模糊性和不确定性以及观测资料的不确定性,有效减少模糊评价中的主观性,模型在淮河流域水资源可持续性评价的应用实例显示其评价结果与实际情景相符合。孙才志等在灰色系统理论基础上应用POME提出了水资源承载力评价模型,并对黄河流域山西段的水资源承载力进行了评价。

2.6 在水资源系统决策中的应用

水资源系统决策分析是在多变的环境条件下进行正确决策而提供的一套推理方法、逻辑步骤和具体技术,以及利用这套方法、技术在实际水资源系统问题中选择满意的行动方案的过程。由于决策分析问题的求解受到决策者对决策问题的把握,具体决策问题自然状态的不确定性,决策问题属性及目标的多样化等诸多因素的影响,实际系统的决策问题通常十分复杂。1994年王建群以水资源系统为背景,探讨了不确定性、风险、可靠性、不确定型决策、风险决策及完全不确定型决策等基本概念,认为水资源系统的决策伴随着大量的不确定性因素,传统的基于数学期望的处理方法存在许多缺陷,探索新的针对不确定性的决策分析方法是今后水资源系统决策的趋势。邱菀华等将信息论方法成功应用于系统决策分析中。基于信息论概念和方法的系统决策分析方法在水资源系统决策分析问题中也取得了较好的应用成果。

1998年,陆菊春根据熵的概念和性质,采用熵权系数法进行了中小型水电工程的决策评价,建立了基于熵的多目标决策评价模型,为多目标决策提供依据。2000年王丽萍、薛年华和纪昌明从系统运行的全局出发,研究了三峡电站在汛期调峰运行的可能性及经济性,鉴于三峡工程规模大、影响范围广、涉及的不确定(风险)因素多,他们依据信息熵原理建立了基于POME的经济风险分析模型,用于指导工程项目的施工管理。同年任鲁川采用信息熵的理论与方法,提出了区域灾害熵、灾害加权熵概念和相应的计算公式,用以衡量区域灾害风险的整体水平。2002年,李继清、张玉山等针对水电站经济效益风险,采用“分解”分析方法辨识出影响水电站经济效益的风险因素,并简要分析了各因素的作用机理,在此基础上建立了基于POME的风险分析模型,为风险分析与决策提供依据。他们在2003年采用层次分析方法,将水利工程经济效益系统分为防洪、发电、灌溉效益子系统,辨识出风险因子,建立了基于POME的经济效益风险分析模型,并给出求解方法。2002年王栋等将熵理论引入到风险分析中,认为熵是衡量系统不确定性程度的一个量度,同时又间接反映了时空量测数据的信息特征,在水系统中将熵理论与风险分析结合起来是有意义的。

3 结 论

以不确定性信息为主要研究对象的信息论方法已在水资源系统工程中取得了许多成功的应用,显示出信息论方法很强的适用性,它已经成为解决水科学问题的一类新的有效工具。但是在应用中由于受到信息论发展水平、实际水问题的复杂性以及人们认识水平的局限性等多方面的影响,信息论方法在水资源系统工程领域中更深入、更广泛的应用尚需广大水科学界的继续努力探索。尤其是被爱因斯坦称为整个科学首要法则的信息论中的熵理论与熵方法,在水科学中的应用研究至今仍处于开创阶段。当前迫切需要深入研究的主要内容有:

(1)信息论中熵学理论与水科学物理基础的结合研究。熵是一个内涵与外延都极其丰富的概念,然而熵学理论本身至今仍不够完善、其理论体系没有建立。今后的研究应进一步加强熵学理论建设,进一步揭示各种水现象的复杂性与热力学熵、统计力学熵、信息熵和其它熵的对应关系,进一步探讨各种水文变量过程、水文变量分布和水文变量约束条件与最大熵原理、最小鉴别信息原理的内在联系,以进一步加强水科学的物理基础,推动水科学不确定性研究的深入发展。

(2)信息论方法与模糊集理论、灰色系统理论、随机水文学理论、遗传算法、神经网络等现代智能水科学方法的结合研究。只有通过这些方法的综合集成研究,才能更深入、更直接、也更简便地处理各种复杂的大规模实际水问题。

(3)基于信息科学、计算机科学与水科学交叉的水信息学的理论与应用相结合的研究。目前对水信息学的理解仅限于水环境科学与信息技术的交叉,是采用遥感、遥测、数据库技术、软件技术、数值分析技术以及各种控制与决策技术等新近发展的方法技术,分析解决水环境科学问题的一门学科。这显然很不全面。水信息学的主要任务之一就是处理水现象和水过程中的各种不确定性,因此信息论方法理应成为水信息学的主要研究方法,而目前这方面的研究既少、又碎。面对数字地球与信息世界背景下的各种水问题,开展水信息学的理论与应用研究,对水科学界而言,既是重要机遇,又是严峻挑战。

(限于篇幅,省略参考文献)

Applications of Information Theory Methods to Water Resources Systems Engineering

ZHANG Ming JIN Ju-liang ZHANG Li-bing

(College of Civil Engineering,Hefei University of Technology,Hefei Anhui230009,China)

Abstract As a new engineering technology of crossover and integration between of water resources science and systems science,water resources systems engineering is of great importance in sustainable development strategy research of regional population,resources,environment,economy and society.The important problem is how to find effectively uncertainty information of practical complex systems of water resources.For this reason,after a brief introduction of the basic concepts and the primary methods of information theory,the applications of the information theory methodsin the water resources systems engineering were divided according to the theory frame of water resources systems engineering.The paper analyzed the applications in the recent years in the process of modeling,optimization,simulation,prediction,evaluation and decision-making of water resource system separately.A discussion was carried on aiming at the problems and settlement methods existing in the applications of information theory methods in water resources systems engineering.The application prospect was presented and the necessity of developing hydro-informatics disciplines were pointed out.The above information theory methods possess of reference and application value in many applied systems engineering sciences such as resources systems engineering,environment systems engineering,and management systems engineering,etc.

Key wordsresources systems engineering;complex system;uncertainty;information theory;entropy;hydro-informatics

注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”

上一篇:循环经济评价指标体系分析 下一篇:硝基苯在傍河地下水源地迁移转化的模拟实验