基于分区的局域神经网络时空建模方法研究

2020-12-17 来源：汇智旅游网

第12卷󰀁第5期2008年9月

遥󰀁感󰀁学󰀁报

JOURNALOFREMOTESENSINGVo.l12,No.5

󰀁Sep.,2008

󰀁󰀁文章编号:1007󰀁4619(2008)05󰀁0707󰀁09

基于分区的局域神经网络时空建模方法研究

王海起

1,2

,王劲峰

(1󰀂中国石油大学(华东)地球资源与信息学院,山东东营󰀁257061;

2󰀂中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京󰀁100101)

摘󰀁要:󰀁区域数据表现为两种尺度的空间特性:反映全局特征的空间依赖性和反映局域特征的空间波动性。空间波动性表现为空间数据在局部地区的聚集或高低交错现象。在研究区域数据时空预测性建模时,从降低数据的空间波动和不平稳性对模型预测能力的影响角度出发,提出了一种基于分区的局域神经网络时空非线性建模的思路。分区过程由基于空间邻接关系的K󰀁means聚类算法完成。不同的分区方案通过相关性、波动性、紧凑性等指标进行评价和优选。在确定最优分区方案的基础上,对各子区分别采用两层前馈网络进行建模,模型的输入不仅要考虑本区内单元的作用,而且要考虑相邻子区的边界效应。各神经网络模型的时空预测能力通过平均相均差和动态相似率等指标进行衡量。最后,通过对法国94个县每周流感报告病例的时空建模分析表明,与全局神经网络模型相比,基于分区的局域神经网络模型具有更好的预测能力。关键词:󰀁格数据;时空建模;分区;K󰀁means聚类;神经网络;边界效应中图分类号:󰀁P208󰀁󰀁文献标识码:󰀁A

空间单元数目较多的情况下,它表现为在局部区

1󰀁引󰀁言

在地理信息科学领域,Cressie将空间数据分为3种主要类型:点模式数据(pointpatterndata)、地学统计数据(geostatisticsdata)和格数据(latticedata)

[1]

域的高值( 热点!)和低值( 冷点!)聚集或异常,从其潜在的空间运动过程来讲,这种现象是由于局部地区空间过程的异质性和空间相互作用的

程度不同造成的。

从时间角度出发,正如单纯的时间序列分析,估计t时刻某一区域的属性值依赖于t时刻之前同一区域的属性值,对于一些在时间上具有马尔可夫性的过程,如某些传染病的时空过程建模,甚至仅需要考虑t-1时刻的属性值。然而,更重要的是,如果忽视t时刻之前其他空间关联区域的作用,将严重影响时空建模的可信度和适用性。

对于区域数据的时空线性关系建模,已经发展了一些时空线性回归模型

[2]

。格数据,也称为区域数据,是指属性数据

关联于固定多边形区域的数据类型,其多边形区域既可以是规则的也可以是不规则的。区域数据分析侧重于对区域空间格局或趋势的探测、建模和解释;区域数据时空分析研究在空间拓扑结构(区域单元的空间排列、形状、大小等)保持不变的情况下,属性数据随时间变化的时空过程和时空格局的探测、建模和预测。

区域时空数据具有空间和时间两方面的属性。从空间角度出发,一方面,正如Tobler地理学第一定理阐述的观点,空间对象呈现出相互依赖的空间格局,并且这种相互依赖性随着空间对象之间距离的增加而减弱。另一方面,假定空间结构在研究区域内具有平稳性是不现实的,特别在

󰀁󰀁收稿日期:2006󰀁12󰀁04;修订日期:2007󰀁09󰀁04

。例如,时空自回归模

型STAR:yt=󰀁Wyt-1+󰀂yt-1+ t,通过引进空间权重矩阵W,不仅考虑了t-1时刻同一区域的属性值,而且考虑了空间相邻区域属性值的作用。实际应用也表明,对于区域数据时空线性建模,STAR模

型的拟合与预测能力均优于单纯的时间序列模型

基金项目:国家自然科学基金项目(编号:40471111)、国家863计划项目(编号:2006AA12Z215)及中国石油大学(华东)博士基金项目(Y060124)共同资助。

作者简介:王海起(1972󰀂󰀁),男。讲师,博士。主要研究方向为地学空间信息分析与智能计算。E󰀁mai:lwanghq@lreis.ac.cn。

󰀁󰀁708

遥󰀁感󰀁学󰀁报

[3]

第12卷

如ARMA、ARIMA模型。同的变化趋势(同为高值或低值);负相关性表明研究区域内空间单元属性与相邻空间单元具有相反

的变化趋势;无相关性则表明空间单元的属性值彼此相互独立,在空间上随机分布。

空间波动(spatialrough)反映空间数据的局部特征。对于区域数据,局域正相关性表现为单个空间单元与其相邻单元属性具有相同的趋势,同为高值(可称为热点!)或同为低值(可称为冷点!);局域负相关性表现为单个空间单元与其相邻区域具有相反的趋势,为高低或低高交错(可称为异常!)。

用于探测区域数据这两个不同尺度空间格局的全局和局域统计量包括Moran∀sI,Getis∀G和Geary∀sc统计量等。

2󰀂1󰀁全局统计量GlobalMoran∀sI

用于探测区域数据的全局空间自相关性,其公[6]

式如下:

n#I=

实际上,现实中的区域数据常常表现出非线性、复杂性等特点,难以用简单的线性方程进行建模和逼近,这时采用一些较为复杂的建模手段,如神经网络模型,也许能提高时空预测的结果。

神经网络(artificialneuralnetworks,简称NN)模型应用于区域数据时空建模和预测有其自身的不足,一方面,大部分NN模型都是一种黑箱!结构,选择合适的网络结构和训练算法往往非常困难,如果不考虑研究对象的先验知识,应用NN进行建模常常导致错误的结果;另一方面,大部分神经网络算法的调整主要基于机器学习理论的角度,很少基于研究问题的领域知识,导致对其预测的结果往往难以进行解释。因此,如果对于研究问题存在简单且有效的方法时,没有必要使用如此复杂的模型;然而,当研究对象比较复杂且简单的方法不再适用时,在牺牲模型易于解释的代价基础上,为了得到更好的预测结果,可以考虑使用NN模型

[4]

。

∃∃

i=1j=1

wij(xi-x)(xj-x)

本文研究神经网络模型在区域数据时空分析中的应用。基于对空间格局局部不稳定的考虑,首先采用基于空间邻接关系的改进K󰀁means聚类算法对研究区域的空间单元进行分区划分,提出了利用全局和局部Moran∀sI统计量的关系对不同分区方案进行定量评价的方法;在选择合适分区的基础上对各子区分别采用一个基于BP训练算法的多层前馈网络进行时空建模与预测。同时对整个研究区域建立一个全局的多层前馈网络模型。为了比较全局和局域NN模型效果,采用法国1990年第1周至1992年第53周3年共157周94个县流感报告病例数进行实例分析,以第t周各区患病人数作为输入数据,以第t+1周各区患病人数作为预测数据。

∃∃w

i=1j=1,j%inn

∃

(2)

(xi-x)

i=1

式中,xi是空间单元i的属性值,x是研究区域n个

空间单元的属性平均值,wij是空间权重矩阵W的元素,定义了单元i与单元j的相关关系。

当Moran∀sI值为正数且显著时表明存在空间正相关性;当Moran∀sI值为负数且显著时表明存在空间负相关性;当Moran∀sI近似为零时表明为空间随机分布。

2󰀂2󰀁局域统计量LocalMoran∀sI

Anselin将其称为LISA,即空间关联局域指标(localindicatorofspatialassociation),对于空间单元i其公式为

[7]

n#(xi-x)

j=1,j%i

2󰀁区域数据的全局和局域Moran∀sI统计量

󰀁󰀁从空间数据探索性分析角度出发,空间数据可认为由两部分组成

[5]

Ii=

∃

wij(xj-x)

(3)

∃

i=1

(xi-x)

Spatialdata=spatialsmooth+spatialrough(1)空间趋势或平滑(spatialsmooth)反映空间数据的全局或整体特征,对于区域数据,它与全局(大尺度)的空间自相关模式相关。空间正相关性表明研究区域内空间单元属性与其相邻空间单元具有相当Ii为正数且显著时,表明空间单元i与其相邻单元存在高值或低值的聚集现象;当Ii为负数且显著时,表明空间单元i与其相邻单元存在高低或低高交错现象;否则表明存在局部的空间随机现象。

2󰀂3󰀁全局和局域Moran∀sI之间的关系

当空间权重矩阵W采用空间邻接形式,即若单第5期王海起等:基于分区的局域神经网络时空建模方法研究

709󰀁󰀁

元i与单元j具有共同边界则wij=1,否则wij=0,并且矩阵W是行标准化形式(每行元素之和为1)时,公式(2)与公式(3)之间的关系可表达为

[7]

(2)邻接性(contiguity)

邻接性意味着在分区时,只有空间相邻单元才能归到同一子区中。邻接性的考虑将通过对K󰀁means聚类方法的改进而得以实现。

(3)紧凑性(compactness)

紧凑性关注于各子区的空间形状,它保证在分区结果中总是优先考虑那些相邻空间单元距离较近的方案,一些学者认为空间紧凑性与我们对社会

[10]

和经济活动的直观理解!是一致的。对于一个子区,通过计算该子区质心与子区包含的各空间单元质心的平均距离(也称为离散度)作为衡量紧凑性的性能指标,该公式如下:

1d=

(4)

∃I

i=1

公式(4)表明,对于一个研究区域,局域Moran∀sI的平均值即是全局Moran∀sI值。因此,当整个区域的空间过程较为平稳或空间波动不明显时,可以预期局域Moran∀sI值围绕全局Moran∀sI值的波动较小;反之,当空间过程不平稳或空间波动较明显时,局域Moran∀sI与全局Moran∀sI具有较大的差异。

因此,可以用LocalMoran∀sI与其平均值GlobalMoran∀sI的标准偏差作为度量一个区域波动程度(或平稳性)的指标,其公式如下:

Std(I)=

n∃

i=1

(xi-xg)+(yi-yg)

22(6)

式中,n是子区包含的空间单元数目;xi,yi是空间单元i的质心坐标;xg,yg是该子区的质心坐标。如

(5)

果离散度较小,则表明该子区内的单元较为紧凑;否则,表明该子区较为松散。

(4)相互依赖性(interdependence)

相互依赖性保证一个子区内的空间单元之间具有关联性。对于基于分区的局域神经网络时空建模,各空间单元t时刻某个属性值的预测(作为输出层节点)实际上是利用t时刻之前各单元的属性值(作为输入层节点)之间的相互作用(通过隐含层)实现的,因此,分区方案必须保证子区内的空间单元存在实际的空间相互作用或依赖性。每个子区的空间依赖性可利用该子区的全局Moran∀sI系数进行评估。

(5)不平稳性(instability)

虽然使每个子区具有完全平稳性是不可能的,但是不平稳性越低意味着NN模型的预测效果

[4]

越好。各子区的平稳性由前述的Std(I)指标衡量。

由上述分析可以看出,在对不同的分区方案进行评价时,各分区指标起到的作用是不同的。首先,相互依赖性是必要条件,不满足此条件的分区结果不能使用;其次,不平稳性是优先考虑的指标,对于那些Std(I)相差无几的方案,可进一步利用离散度进行评价;最后,简洁性是可选标准,在随后的应用实例中并没有使用。

需要指出的是,NN模型研究的是区域时空数据,而上述分区标准(4),(5)涉及的Moran∀sI系数只是纯粹的空间相关性指标,因此对时空数据采用空间Moran∀sI指标衡量并不合适。然而,从已有文献的检索中并没有找到合适的可用于区域时空∃

(Ii-I)

i=1

在下一节中,Std(I)将作为不同分区方案是否稳定的一个评价指标。一个子区的Std(I)值相对较小,表明该子区的平稳性较好、波动较弱;否则,表明该子区的平稳性较差、波动较强。

3󰀁分区标准

类似于地理学中的区划思想,分区的目的是根据一组评价标准利用空间单元的属性数据对研究区域的单元进行划分,使所有空间单元归到不同的子区中。对具有时空属性数据的区域单元进行分区时,可以将同一属性在不同时期的观测值作为不同的属性来对待,如:某县报告的12个月每月流感患病人数可以看作12个不同的属性数据。

Cliff等人给出了一个最佳的( optimal!)区划方案在一般情况下应满足的3个标准:简洁性(simplicity)、均质性(homogeneity)和空间紧凑性(compactness)

[8,9]

。根据局域神经网络建模的需

要,综合上述区划标准以及另外的两个附加标准来构建我们的分区评价指标。

(1)简洁性(simplicity)

对于局域时空建模,需要对分区方案中的每个子区分别建立一个模型,子区数目较少,需要建立的模型及相应的计算量就较少,对于NN模型来说用于模型学习时间的减少更为明显。因此,当其他分区标准难以确定不同分区方案的优劣时,分区数目较少的方案总是优于分区数目较多的方案。󰀁󰀁710

遥󰀁感󰀁学󰀁报第12卷

相关性计算和检验的全局和局域时空统计量,这里,采用一种折衷的方法,对于研究的时空变量(如:不同时间不同县的流感患病人数),构造一个统计量,使得对于每个空间单元,该统计量是研究变量的不同时间观测值的函数(如:不同时期流感病例的平均值、总和或最大值等)。

(2)对每个单元si,设研究的单元时空属性变量为Xi)X(si)=[xi1,xi2,&,xiT],T是时间维的长度。

(3)对每个单元si,构造一个统计量Qi)Q(si)=f(Xi)=f(xi1,xi2,&,xiT),Qi是时空属性变量Xi

的函数,用于评价分区结果的空间Moran∀sI系数计算。

其次,对于K󰀁means聚类算法作如下定义:(1)定义{z1,z2,&,zK}为K个聚类中心,每个聚类中心zj=[zj1,zj2,&,zjT](j=1,2,&,K)。(2)对每个聚类中心zj定义一个集合Zj,用于存放该类别中包含的空间单元,初始化时集合Zj为空。

(3)定义N∋K的二维距离矩阵Dis,t用于存放每个空间单元与每个聚类中心的距离。同时定义矩阵Dist的N∋K辅助逻辑矩阵DisMtark,用于标识在距离矩阵Dist中搜索单元到聚类中心的最短距离时该距离是否参与搜索过程,若矩阵DisMtark中某元素值为True,则矩阵Dist中对应距离参与搜索,否则不参与搜索。4󰀂2󰀁算法流程

基于空间邻接关系的K󰀁means聚类算法详细流程请参考文献[13]。

利用该算法,通过指定不同类别数K,可以得到不同K值的分区方案。对不同分区方案,利用分区标准进行优选。

首先,对指定类别数为K的分区方案的各个子区,分别将各子区作为单独研究区域计算其统计量Q的全局Moran∀sI系数,若存在没有空间相关性或相关性不显著的子区,则类别数为K的分区方案将被淘汰;其次,对通过相关性检验的每个K类分区方案,再分别以各子区作为单独研究区域计算各自的平稳性指标Std(I)和离散度指标d,将各子区指标的平均值作为每个K类分区方案的平稳性和紧凑型的指标结果;最后,从中选择平稳性最好(Std(I)值最小)、离散度最小的分区方案作为最终的分区结果。

4󰀁基于空间邻接关系的K󰀁means聚类方法

󰀁󰀁聚类方法是将研究对象按照其特征分组为多个类,使每个类对象之间具有较高的相似性,而不同类对象之间的差别较大。K󰀁means方法由MacQueen于1967年提出,是目前应用最为广泛的一种聚类方法。

利用聚类方法对空间单元进行分区时,要求同一子区的单元在空间上处于相邻的位置,在地图上表现为彼此相连的状态。而传统的聚类方法仅利用空间单元的属性数据,并没有考虑单元的空间邻接关系。有研究对空间单元聚类时,将单元的空间坐标作为额外的属性变量加以考虑,然而这种方法得到的同一子区的单元仍然可能出现在空间不相邻的位置方法

[10]

;也有研究提出了新的空间单元分区

[11,12]

。

本文利用K󰀁means聚类方法对空间单元进行分区,在分区过程中将空间邻接关系作为约束条件加以考虑。在对每个空间单元进行类别归属判断时,不仅要考虑单元与某类别中心的距离,而且要考虑单元与该类别中空间单元的邻接关系;只有当该类别与进行归属判断的空间单元之间存在邻接关系且距离最短时,单元才可以归属于该类。这样,对于最终的分区结果,既保证了同一类单元的属性值差别较小、不同类之间属性值差别较大,又保证了同一类的空间单元在空间上处于相邻的位置。4󰀂1󰀁相关定义

首先对研究的区域时空对象作如下定义:(1)设研究区域S有N个空间单元S={s1,s2,&,sN}及邻接关系(neighborrelation)R S∋S。空间单元si和sj具有邻接关系当且仅当(si,sj)(R,i%j。用空间邻接矩阵W表达邻接关系R,W(i,j)=Wij=1当且仅当(si,sj)(R,否则W(i,j)=Wij=0。5󰀁神经网络建模及其边界效应

5󰀂1󰀁神经网络模型

󰀁󰀁在确定最终分区方案的基础上,可以对各子区分别进行神经网络时空建模和预测。由于多层前第5期王海起等:基于分区的局域神经网络时空建模方法研究

711󰀁󰀁

馈网络模型可以对任意的输入󰀁输出映射进行建模并在实际应用特别是预测问题中得到了广泛的应用,并且理论已经证明:具有单隐层的前馈模型可以任意的精度逼近任意复杂的非线性函数,因此,采用两层前馈网络(包括隐含层、输出层,不包括输

入层)进行建模。

对于区域单元时空预测性建模,模型输出是t时刻各单元的预测值Xt,输入是t时刻之前相关时段各空间单元的观测值,神经网络建立如下的函数映射关系:

Xt=f(Xt-1,Xt-2,&,Xt-p)

(7)

因此,NN模型实际上是一个非线性的时空自回归模型。p是时间滑动窗口步长,用于决定建模时的相关时间滞后项,例如,对于T个时间的观测向量X1,X2,&,XT,每个Xt=[xt1,xt2,&,xtN]表示空间N个单元的观测值,进行一步预测(1󰀁step󰀁ahead)时,第1个输入󰀁输出模式的输入是X1,X2,&,Xp;预期输出是Xp+1;第2个输入󰀁输出模式的输入是X2,X3,&,Xp+1;预期输出是Xp+2,&,最后,第T-p个输入󰀁输出模式的输入是Xt-p,Xt-p+1,&,XT-1、预期输出是XT。

目前,滑动窗口步长p的确定并没有合适的方法,有研究利用线性关系的时空自相关函数和时空偏自相关函数来确定时间阶数p,也有学者认为这种方法对于神经网络的非线性滞后并不合适

[14]

型的结果也是令人难以接受的。因此,采用对各个子区分别进行NN非线性建模时,不仅要考虑子区内各单元的观测值对模型预测结果的作用,而

且应引入与其相邻的空间区域的作用因素,即边界效应。

这里,把与子区直接相邻(边相邻或顶点相邻)的边界空间单元t时刻之前的观测值也作为NN模型的输入加以考虑,这样,局域NN模型输出的各单元t时刻预测结果不仅是子区内各单元t时刻之前观测值的函数,而且是其周围边界单元t时刻之前观测值的函数。对于一步预测建模,若设一个子区的单元数目为n,与其相邻的单元数目为m,时间滑动窗口步长为p,那么,该子区的局域NN模型的输入层节点个数为(n+m)∋p,输出层节点个数为n。

6󰀁应用实例

例

[16]

研究数据采用法国94个县的每周流感报告病,时间为1990年第1周至1992年第53周共以每周流感平均患病人数构造空间统计量Q,

157周,图1(a)为法国94个县的数字编号。其空间分布见图1(b)。空间邻接矩阵W采用边界直接相邻的一阶形式,根据各县每周平均病例计算的94个县全局Moran∀sI=0.1281,假设检验表明流感病例具有显著的空间正相关(图2),说明法国各县流感具有空间自相关性,而且呈现出高发区与高发区相邻、低发区与低发区相邻的空间格局。6󰀂1󰀁分区

以每周流感病例作为各县的属性数据,各空间单元分别具有157个属性数据,以一阶邻接矩阵W作为约束条件,对法国94个县进行K󰀁means聚类分区。由于事先无法确定聚类的类别数K,依次取K值为4󰀂16之间的数值,分别进行聚类计算,通过不同分区方案的相关性检验,最后具有显著空间相关性的类别数K分别为8,9,10,12,14,16;分别计算这6个不同分区方案的Std(I)指标,离散度指标(表1),最终选择的最优类别数K=12。

分区数为12的各子区空间分布见图1(c),从图1(b)与图1(c)的对比可以看出,最终的分区方案也反映了流感病例的空间分布格局。表2给出了。

实际使用时,常采用多次试验(try󰀁and󰀁error)的方式。

NN模型的性能评价主要通过检验数据集衡量所建立的模型对于新输入的预测能力,即泛化能力,主要包括平均相均差ARV和动态相似率DSR两个指标近程度。5󰀂2󰀁边界效应

采用分区的思路进行局域神经网络建模,并不表明不同子区的空间单元之间没有关联性,相反,可能存在着其他形式的相关关系,如经济、交通和人口等形式,而这些形式的相关关系并不能被简单的空间邻接矩阵所表现和度量,因此,在建模时如果仅考虑子区内的单元对模型输出的影响,而忽视子区周围单元的影响因素,等于人为割裂!了不同空间区域单元之间的相互联系和空间依赖关系,这与地理学第一定理是相违背的,模[15]

,前者反映模型预测输出的准确

程度,后者反映模型预测的趋势与实际趋势的接

󰀁󰀁712

遥󰀁感󰀁学󰀁报第12卷

图1󰀁法国94个县流感病例分区情况

(a)94个县数字编号;(b)94个县1990年第1周至1992年第53周平均每周流感报告病例分级图;

(c)类别数为12的分区结果;(d)第1分区及相邻的边界区域单元

Fig.1󰀁Partitioningforflucasesof94countiesinFrance

(a)numberIDsof94counties;(b)averageweeklyflucasesof94countiesfromthe1stweekof1990tothe53thweekof1992;

(c)thepartitionmapofK=12for94counties;(d)thefirstsubareaanditsneighboringregions

分区数为12的各子区包含的空间单元数目,各自的空间相关性指标全局Moran∀sI值和相应的Z得分检验值,平稳性指标Std(I)值。

表1󰀁6个不同类别数K的分区方案评价指标结果

Table1󰀁Theresultsofpartitioncriteria

forsixpartitionschemes

类别数K

8910

平稳性指标Std(I)

0.66760.66140.65890.52510.58840.5345

离散度指标d

897.68612.341434.101030.27964.76664.39

图2󰀁法国94个县平均每周流感病例的

全局Moran∀sI散点图

Fig󰀂2󰀁GlobalMoran∀sIofaverageweekly

flucasesfor94countiesinFrance

121416

第5期王海起等:基于分区的局域神经网络时空建模方法研究

表2󰀁分区数为12的各子区相关指标结果

713󰀁󰀁

󰀁󰀁为了比较局域NN模型的效果,同时对整个研究区域94个县建立一个全局NN模型,输入数据为第t-1周各县流感病例,预期输出为第t周各县流

感病例,即输入与输出节点数均为94。

表3󰀁各子区NN模型的输入层和输出层节点数Table3󰀁Thenumberofinputnodesandoutputnodesof

eachNNmodelfortwelvesubareas

输入节点数

第1子区第2子区第3子区第4子区第5子区

36915108321728622247

输出节点数

205623187151881

Table2󰀁Relevantstatisticofeachsubareainthe

partitionschemeofK=12

空间单元数

第1子区第2子区第3子区第4子区第5子区第6子区第7子区第8子区第9子区第10子区第11子区第12子区

205623187151881

0.53260.4070

2.14902.2162

0.66620.4026

全局Moran∀sI-0.33920.73020.2141-1-1.91900.25060.39480.3195

Z得分检验-1.97992.92242.0218-∗-4.01351.97252.71971.9934

Std(I)值0.42270.41930.279200.34220.67800.65160.4449

第6子区第7子区第8子区第9子区

6󰀂2󰀁神经网络建模

对12个子区分别建立一个神经网络模型,每个局域NN模型利用第t-1,t-2,&,t-p周各县的流感病例,预测第t周本子区各县的流感患病人

数。由于流行性感冒的传染期约为1周,对于以周为时间单位的建模,输入可以仅考虑第t-1周的病例,即p=1。

因此,各NN模型的输出层节点数等于本子区包含的空间单元个数,输入层节点数为本区单元个数与周围边界单元个数之和,图1(d)为第1子区及其相邻的边界单元,表3为各子区NN模型的输入层、输出层节点数。

第10子区第11子区第12子区

󰀁󰀁针对上述的局域和全局NN模型,将各子区156个观测数据对(Xt-1,Xt),其中Xt-1,Xt分别是t-1时刻,t时刻空间单元的观测向量;按90%+

10%比例随机分为训练集(traindataset)和检验集(testdataset),训练集为140对样本,检验集为16对样本。采用BP算法进行模型训练与调整,再利用检验集对模型进行检验。最后由各局域和全局NN模型得到的法国94个县各县检验数据的平均相均差ARV、动态相似率DSR指标结果见图3和图4(横

图3󰀁法国94个县全局和局域NN模型检验数据集的平均相均差对比图Fig.3󰀁Testdataset∀sARVoflocalandglobalNNmodelfor94countiesinFrance

󰀁󰀁714

遥󰀁感󰀁学󰀁报第12卷

图4󰀁法国94个县全局和局域NN模型检验数据集的动态相似率对比图Fig.4󰀁Testdataset∀sDSRoflocalandglobalNNmodelfor94countiesinFrance

坐标是各县的数字编号,与图1(a)对应)。可以看出,基于分区的局域神经网络模型的预测能力明显优于全局NN模型。

ResourcesResearch,CAS:GraduateSchoolofChineseAcademyofSciences,2005.[韩卫国.数据驱动和模型驱动的时空数据挖掘[D].中国科学院地理科学与资源研究所:中国科学院研究生院博士学位论文,2005.]

[4]󰀁GilardiN,BengioS.LocalMachineLearningModelsforSpatial

DataAnalysis[J].JournalofGeographicInformationandDecisionAnalysis,2000,4(1):11󰀂28.

[5]󰀁HainingR.SpatialDataAnalysis:TheoryandPractice[M].

London:CambridgeUniversityPress,2003.

[6]󰀁AnselinLuc.SpatialEconometrics:MethodsandModels[M].

Dordrecht:KluwerAcademic,1988.

[7]󰀁AnselinLuc.LocalIndicatorsofSpatialAssociation󰀁LISA[J].

GeographicalAnalysis,1995,27(2):93󰀂115.

[8]󰀁HainingR,WiseS,MaJ.DesigningandImplementingSoftware

forSpatialStatisticalAnalysisinaGISEnvironment[J].JournalofGeographicalSystems,2000,2:257󰀂286.

[9]󰀁CliffAD,HaggettP,OrdJK,etal.

UniversityPress,1975.

[10]󰀁WiseS,

HainingR,MaJ.

RegionalizationToolsforthe

Spatial

ExploratorySpatialAnalysisofHealthData[A].FisherM,Getis

RecentDevelopmentsinSpatialDataAnalysis:Statistics,

Behaviora,lModelingandNeuro󰀁computing[C].

ElementsofSpatial

Structure:AQuantitativeApproach[M].London:Cambridge

7󰀁结论与讨论

针对GIS格数据时空非线性建模,从降低数据的空间波动和不平稳性对模型预测能力的影响角

度出发,提出了一种基于分区的局域神经网络建模的思路,分区的目的是使在全局尺度上表现为空间波动的局部区域,通过分区在较小尺度上表现为较强的空间相关性和较弱的空间波动性。

需要指出的是,在采用K󰀁means聚类算法进行分区时,初始聚类中心的选择对最终的分区结果具有重要的影响,对于空间聚类,随机选择初始聚类中心并不是一个合适的方法,进一步的研究应结合研究区域的空间格局,如:考虑局部的热点!或冷点!区域,使初始聚类中心的确定与空间格局建立联系。另外,对于分区标准,有必要进一步细化研究,对于不同类型的空间过程可能会有不同的评价标准,对于反映空间波动和不稳定性的指标需作更深入的分析,对于区域时空过程,研究相应的时空评价指标和检验方法更是势在必行。参考文献(References)

[1]󰀁CressieAC.StatisticsforSpatialData[M].NewYork:Wiley,

1991.

[2]󰀁KamarianakisY.Spatial󰀁TimeSeriesModeling:AReviewofthe

ProposedMethodologies[A].

Proceedingsofthe8thAGILE

ConferenceonGIScience[C].Portuga,l2005.

[3]󰀁HanWG.Data󰀁DrivenandModel󰀁DrivenSpatio󰀁TemporalData

Mining[D].

InstituteofGeographicSciencesandNatural

Berlin:Springer,1997.

[11]󰀁LeungY,ZhangJ,XuZ.ClusteringbyScale󰀁SpaceFiltering

[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2000,22(12):1396󰀂1410.

[12]󰀁LuoJC,ZhouCH,LeungYee,etal.Scale󰀁SpaceTheory

BasedRegionalizationforSpatialCells[J].ActaGeographicaSinica,2002,52(2):167󰀂173.[骆剑承,周成虎,梁怡等.多尺度空间单元区域划分方法[J].地理学报,2002,57(2):167󰀂173.]

[13]󰀁WangHQ,WangJF.AnAdaptedK󰀁meansAlgorithmBasedon

SpatialContiguityRelations[J].ComputerEngineering,2006,32(21):50󰀂51.[王海起,王劲峰.一种基于空间邻接关系的K󰀁means聚类改进算法.计算机工程,2006,32(21):50󰀂51.]

[14]󰀁ZhangG,PatuwoBE,HuMY.

ForecastingwithArtificial第5期王海起等:基于分区的局域神经网络时空建模方法研究

报,1995,50(增刊):54󰀂61.]

715󰀁󰀁

NeuralNetworks:TheStateoftheArt[J].InternationalJournalofForecasting,1998,14:35󰀂62.

[15]󰀁WangJF.

StructuralAdaptiveModelingofSpatialGeo󰀁

information[J].ActaGeographicaSinica,1995,50(Supp.l):54󰀂61.[王劲峰.空间信息的结构自适应模型[J].地理学

[16]󰀁DataSourceofFranceFlu:www.sph.umich.edu/geomed/data/

france/.[法国流感数据来源:www.sph.umich.edu/geomed/data/france/.]

LocalNeuralNetworksofSpace󰀁timeModelingBasedonPartitioning

forLatticeDatainGIS

WANGHai󰀁qi,WANGJin󰀁feng

1,2

(1.CollegeofGeo󰀁resourcesandInformation,UniversityofPetroleum(EastChina),DongyingShandong󰀁257061,China;2.LREIS,InstituteofGeographicSciencesandNationalResourcesResearch,ChineseAcademyofSciences,Beijing100101,China)

Abstract:󰀁Thispaperfocusesonspace󰀁tmienonlinearintelligentmodelingforlatticedata.Latticedatarefersto

attributesattachedtofixed,regularorirregular,polygonalregionssuchasdistrictsorcensuszonesintwo󰀁dmiensionalspace.Latticedataspace󰀁tmieanalysisisamiingatdetecting,modelingandpredictingspace󰀁tmiepatternsortrendsoflatticeattributeschangedwithtmiewhilespatialtopologicalstructuresaresmiultaneouslykeptinvariable.Fromtheperspectiveofspace,latticeobjectshavetwodifferentscalespatialpropertiesinfluencinglatticedatamodeling:globaldependenceandlocalfluctuation.Globalspatialdependenceorautocorrelationquantifiesthecorrelationofthesameattributeatdifferentspatiallocations,andlocalspatialfluctuationorrough,coexistedwithglobaldependence,isrepresentedintheformoflocalspatialclusteringofsmiilarvaluesorlocalspatialoutliers.Toconsidersmiultaneouslytheeffectsoftwopropertiesabove,localneuralnetworks(NN)modelisstudiedforspace󰀁tmienonlinearautoregressivemodeling.Themainresearchcontentsinclude:(1)ToreduceinfluenceofspatialfluctuationonpredictionaccuracyofNN,allregionsarepartitionedintoseveralsubareasbyanmiprovedk󰀁meansalgorithm.(2)Differentpartitionschemesareevaluatedandcomparedaccordingtothreeessentialcriteriaincludingdependence,continuity,fluctuation.DependencemeansthatanoptmialpartitionmustguaranteethatthereisrealandsignificantspatialdependenceamongregionsinasubareabecausetheresultsofoutputlayernodesinaNNmodeldependingontheinteractionsofinputlayernodesthroughhiddenlayersnodes.SpatialautocorrelationofasubareacanbemeasuredbyglobalMoran∀sIanditssignificancetestcanbedonebasedonz󰀁scoreofMoran∀sI.Continuitymeansthatonlyneighboringregionscanbegroupedintoasubarea,andthiscriterionisfusedintothemodifiedk󰀁meansalgorithm.Whenthealgorithmjudgesoneregionwhichsubareaitbelongsto,notonlyshouldthedistancebeconsideredtothecentroidofasubareabutalsothecommonbordersbetweenthisregionandtheregionsinasubarea.Astofluctuation,althoughitismipossibletomakeeachsubareahavecompletespatialstabilitythroughpartitioning,thelessfluctuationmeansthebetterpredictingresultsofNNmode.lForasubarea,standarddeviationbetweenlocalMoran∀sIofallregionsinthesubareaandglobalMoran∀sIofthesubareaisregardedasanevaluationindextothefluctuationofthesubarea.(3)Eachmulti󰀁layerperceptrons(MLPs)networkisusedrespectivelyinmodelingandpredictingforeachsubarea.Theoutputnodesarethepredictingvaluesattmietofanattributeforallregionsinasubarea.Theinputnodesareobservationsbeforetmietofthesameattributeofbothregionsinthesubareaandregionsneighboringtothesubareaandthelatteriscalledboundaryeffect.Finally,asacasestudy,alllocalmodelsofallthesubareasaretrained,testedandcomparedwithasingleglobalMLPsnetworkbymodelingone󰀁step󰀁aheadpredictionofanepidemicdatasetwhichrecordsweeklyinfluenzacasesof94departmentsinFrancefromthefirstweekof1990tothe53thof1992.Twoperformancemeasures,includingaveragerelativevariance(ARV)anddynamicsmiilarityrate(DSR),indicatethatlocalNNmodelbasedonpartitioninghasbetterpredictingcapabilitythanglobalNNmode.lSeveralissuesarestillworthfurtherstudy:(1)Theinitialsubareasofpartitioningareselectedrandomlyinourresearch.Inthefurtherstudy,areasonableapproachshouldcombineselectionwithspatialpatterns,forinstanceconsideringthecenteroflocalcluster.(2)Partitioncriteriashouldbeanotherissueanddifferenttypesofspatialandspace󰀁tmieprocesses,suchasrainfal,lpricewaves,publicdata,etc,mayhavedifferentobjectivecriteriaforchoosinganoptmialpartition.(3)Itmaybemoremiperativetostudyfeasiblemeasuresforquantifyingglobalandlocalspace󰀁tmiedependenceoflatticedataandtestingsignificanceofthisdependence.Key󰀁words:󰀁latticedata;space󰀁tmiemodeling;partitioning;K󰀁meansclustering;neuralnetworks;boundaryeffect

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

基于分区的局域神经网络时空建模方法研究