Kriging空间插值最优估计模型的研究

时间:2022-04-14 01:33:16

Kriging空间插值最优估计模型的研究

摘要: 空间插值对土地价格、降雨量、人口分布,等进行估计是最常用也是最有效的方法。空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。Kriging插值方法以统计学理论为基础。如果采样点数据比较少的情况下,可设计出对Kriging插值的半变异函数进行拟合的实验方案,并从中选出误差最小的估计模型。

关键词: 地统计分析; Kriging插值;误差分析

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)09-2142-03

空间插值对土地价格、降雨量、人口分布,等进行估计是最常用也是最有效的方法。利用Kriging插值法对。该文通过误差分析得到精度最高的估计模型,为各种应用选择最优模型。

1 Kriging空间插值模型

土地价格估计模型确定的基本流程中,最重要的是半变异函数的系数估计。而半变异函数与Kriging插值模型参数的确定具有直接的关系,为此,需要确定插值模型的具体参数以确保土地价格的空间内插估计。

1.1 Kriging空间插值方法的特点

Kriging法是一种空间插值方法,也是地统计学的主要方法,它基于变量相关性和变异性,在有限区域内对区域化变量的取值进行无偏、最优估计。它具有2个明显优势:①在数据网格化过程中考虑了被描述对象的空间相关性质,使估计结果更科学、更接近实际情况;②给出了估计误差,使估值精度更明了。Kriging插值法以空间统计学作为基础,可以得到内插过程中的误差,而且对于密度较小、分布不均匀的数据,使用Kriging插值法有一定的优势

Kriging插值方法以统计学理论为基础,利用半变异函数计算数据点之间的空间关系。半变异函数以区域化变量理论为基础,通过对变异函数的计算以及变异曲线的分析,判断数据的变异特征和变异类型【5】;同时,半变异函数还可以得到较准确的精度。

使用Kriging插值法,对于区域中某一个估计点的值是由它周围的一些已知数据估计得到的。与的数学关系为:

式中:[λi]为加权系数。[λi]可由公式(2)确定【3】:

1.2 模型估计数据预分析

确定出空间插值方法及半变异函数模型后,需要对半变异函数的系数进行估计,而系数的确定与数据的分布特征和统计学特征有着密切的关系,因此,分布特征分析、趋势分析和相关性分析这些数据特征的分析方法便可以用于估计系数的确定。

1.2.1 分布特性分析

数据的空间分布特性对空间插值方法的选择和估计模型的预测均有重要作用。因此需要首先了解数据的空间分布状况。从住宅用地土地价格直方图中可以看出土地价格分布特征类似于指数函数。另外,还可以对原始数据做正态变换,观察插值结果的精度变化。数据变换主要方法有对数法、Box-Cox法。经过试验,系数为0.06的Box-Cox方法得到的变换效果更好。变换前后的分布情况如图2。变换后图像趋近于正太分布,有利于对数据结构进行进一步分析。Box-Cox变换如公式(4)

1.2.2 趋势性分析

如果数据的分布在空间上与某种曲面相似,则可以利用数学公式对这样的分布进行表达。但是有时数据表面并不是数学公式拟合后的平滑表面,会有许多的起伏。想要研究这些起伏对数学模型的影响,就需要将数据中所包含的有规律的曲面(也称趋势面)去除,之后再对剔除趋势面的差值进行分析,便可以得到数据在空间分布中的微小变化规律。本例中土地价格数据的空间分布特征是以市中心为最高点,向周围逐渐递减,在三维空间中形成一个具有最大值的二次曲面,因此可以用二次多项式来表示这种趋势。

1.3 模型系数估计

确定了空间插值方法后,需要得到模型的最佳参数,Kriging插值法的参数主要为半变异函数的系数,分别称为块金值、自相关阈值及基台值。估计半变异函数,首先要确定一个合适的步长大小。为了减少无关的数据在计算中可能的合并运算而将数据点对分成不同的距离级,该距离级的大小就是步长,这种方法称为步氏分组【4】。步长的确定与实际使用的数据相关,因此利用不同的数据进行价格估计前均需要确定步长大小。通过计算,实验数据最合适步长为900米,步长组数为12。给出步长大小后,便可以利用实验数据估计出半变异函数。

通过对数据进行预分析,可以得出五种变换方案,这些方案用于对半变异函数的系数进行估计。第一种方法利用地统计分析模块的缺省值进行估计,也就是不采用数据转换和趋势剔除;第二种方法对数据进行转换,根据前文所得到的结果,使数据最接近正态分布的转换方法为Box-Cox,参数为0.06;第三中方法使用趋势剔除,根据前文得到的结果,采用二次多项式进行剔除;第四种方法则是将二、三方法联合起来,同时进行数据转换和趋势剔除;第五种方法是将Box-Cox的参数进行修正后再与第三种方法联合起来。对比分析这五种方案的估计误差,其中误差最小的结果便是最佳模型的估计方案。五种方案的误差结果如表1:

对于一个预测模型的精确性,其平均标准差接近于0,均方根标准差接近于1,则预测结果的精确性越高。从表1中可以看到,Box-Cox转换方法对于平均标准差的精度有较好的提高,但均方根标准差则相差较大;二次多项式趋势剔除方法较好的提高了预测模型的精度;第四种方法产生了较大的误差结果分析原因是由于趋势剔除后数据的分布方式发生了一定的变化,导致原来的变换形式无法使数据达到较好的正态性,因此需要对Box-Cox变换方法进行修正。从表1中可以看出,第2种方法平均标准差最小,均方根标准差处于中等水平,考虑到平均标准差是衡量误差大小的直接数据,收到误差传播的影响较小,因此选择这种方法得到的结果作为半变异函数的最佳系数,选择的变换方法为Box-Cox,系数为0.06。

1.4 模型检验

对估计结果进行对比,发现方法3和方法5在平均标准差和均方根标准差两项精度指标中各有优势,还需要对两种方法对土地价格进行估计的结果进行检验。利用空间插值得到的结果对原始数据的土地价格进行估计,再将估计值与原始数据进行对比。计算估计值与实测值间的方差,计算结果为空间插值最优估计模型的研究-7AA\image30.png由此可见方法三的估计精度更高。

根据上文的分析,最终采用第3种方法得到预测模型为最佳估计值。由这种方法得到的估计参数为:块金值23196,偏基台值为118690,阈值为4881.72,步长900,半变异函数模型为球状模型。最终得到半变异函数的估计模型为:

2 结论

本文根据半变异函数的特征将数据的空间分布与统计学分布相结合,确立了模型估计的思路。同时利用误差分析的方法在几种模型估计方案中选择出估计误差最小的方案,从而得到了最佳估计模型。通过上文的分析,可以得到以下结论:该文采用了五种方法对半变异函数的系数进行估计。并通过误差检验得到五种方法估计结果的精度以及数据分布情况。最终得到经过Box-Cox变换处理后的估计结果最佳。

参考文献:

[1] 王霞,朱道林.基于Kriging插值方法和GIS技术的地价时空格局研究[J]. 重庆建筑大学学报,2007,29(1): 101-105 .

[2] 曾怀恩,黄声享.基于Kriging方法的空间数据插值研究[J].测绘工程.2007,16(5):5-9.

[3] 郑光辉,黄克龙,张志宏,等. 运用Kriging空间插值技术进行土地级别划分[J].南京师大学报[J].2007,30(1):112-116.

[4] 刘光孟,汪云甲,张海荣.空间分析中几种插值方法的比较研究[J].地理信息世界[J].2011,9(3):41-45.

[5] 胡小荣.变异函数球状模型的拟合研究[J].本溪冶金高等专科学校学报,2000,2(4):41-43.

[6] 曹庭校,秦俊华.半变异函数分析法的初步实践[DB/OL].[2007-6-15],[2011-12-15].中国科技论文在线.

上一篇:Photoshop中常用的抠图方法及照片人物的美化 下一篇:给排水施工工艺与不足简谈