基于空间关联规则的亿元商品交易市场专业化研究

时间:2022-10-26 05:47:17

基于空间关联规则的亿元商品交易市场专业化研究

[摘要] 商品交易市场专业化指数是用来衡量某地区各类商品交易市场经济总量在各类交易市场之间的集中程度。基于前人的研究基础,作者给出了亿元商品交易市场专业化指数计算公式,并将空间关联规则分析引入商品交易市场专业化水平与其他经济因素的关联分析中。在指定的最小支持度和可信度阈值下,获得了3条有意义的商品交易市场专业化水平与其他经济因素之间关联规则。通过这些关联规则,可以对一地区商品交易市场的专业化水平进行预测,为市场合理规划和建设提供决策支持。

[关键词] 亿元商品交易市场 专业化 关联规则 数据挖掘

亿元商品交易市场是指年成交额为1亿元及以上的大型和特大型市场(以后亿元商品交易市场简称商品交易市场)。经过几十年的发展,中国商品交易市场呈现出规模化、规范化、专业化、信息化和高效益化等特征,丰富了人们的物质、精神生活,增强了区域合作,推动了城乡的立体化发展。目前有关商品交易市场的研究多集中于政策研究和基于统计数据的发展趋势分析。在专业商品交易市场方面,更多的学者是不同区域的专业市场进行统计分析,以发现其发展变化的规律。游产业的发展,加强区域合作,形成高度区域一体化,合作立体化。寻找专业化水平高低和相应的区域其他因子之间关联关系对区域商品交易市场的规划和建设都有着重大的意义。商品交易市场专业化的影响因素是分布于一定的区域内,同时具有属性信息和空间信息,并且相互之间存在一定相关性。影响因素分析的方法,一般是多元回归分析或经验模型。首先这些方法不能处理空间信息,其次它们要求数据要满足统计独立性。因此,传统的分析方法无法反应它们之间一种共生或因果关联模式。鉴于以上原因,本文将可以同时处理空间和非空间信息的空间关联分析引入区域商品交易市场的专业化研究中,通过分析相应影响或者共生因素,挖掘其与区域商品交易市场专业化之间的关联模式,为我国亿元商品交易市场的合理规划和建设提供参考依据。

一、数据来源

本文所用有关亿元商品交易市场数据来源于2001年到2007年中国商品交易市场统计年鉴(该统计年鉴最早起始于2001年)。此统计数据包括中国大陆地区的省、地区和直辖市,缺少自治区、香港、澳门、台湾地区的相关统计数据。市场成交额反应了市场的规模,被用于进行商品交易市场专业化指数计算。专业化指数是指一个地区所有类型专业化市场的成交额或其他指标在该地区中所有类型专业市场中的分布情况。因此,专业市场的分类对专业化指数有着很重要的影响。本文采用中国商品交易市场统计年鉴对专业化市场的分类方法将亿元商品专业市场分成,纺织品服鞋帽装市场,食品饮料烟酒市场,家具市场等21类市场(详见中国商品交易市场统计年鉴)。

参与亿元商品交易市场专业化关联分析的要素主要包括,城镇居民恩格尔指数,农村居民恩格尔指数,人口密度,公路密度,铁路密度,个私经济发展水平,贸易竞争,城市化水平,第二产业占所有产业比重,市场化水平,邻域专业化水平。这些数据主要来源于2001到2007年的中国统计年鉴和中国人口统计年鉴。其中有些因素是通过计算得到,例如贸易竞争水平是通过出口额与进口额的比值得到。

二、研究方法

1.商品交易市场的专业化测度方法。在产业经济学中,区位商常被用于衡量区域内部的某一部门专业化水平的高低,如商建初等利用区位商研究了长三角地区工业的行业专业化程度;宗刚等利用?指数及区位商对北京产业结构进行研究。区位商反映的是一个研究区域内某一产业是否具有比较优势,但无法反映各种产业在空间上聚集后专业化的程度。贺灿飞等在研究中国制造业的省区专业化时,引入了一个专业化测度方法来度量各省区的诸产业相对集中指标。当研究区域中所有产值或其他考察变量集中于一个产业时,专业化指数应该最高,理论上应该是1,然而该公式测算的结果为(n-1)/n,只有当n趋于无穷大时才能得到1。当专业化水平较高时,n越大,计算的专业化指数就越精确。商品交易市场专业化指研究区域内所有类型交易市场的交易额或从业人口总数在各类交易市场间的集中程度。当交易额或其他参数在各类交易市场之间平均分布,专业化指数最小,是0;当交易额或其他参数集中于某一类市场,专业化指数最高,是1。为了正确衡量商品交易市场的专业化水平,本文对贺灿飞等人提出的模型进行改进,并用其对中国亿元商品交易市场的专业化水平进行度量。商品交易市场专业化指数的计算公式如下:

(1)

(1)式中,S是研究区域中商品交易市场类型的个数; 为研究区域中每类交易市场占所有类型交易市场的总成交额的比重的平均值;VAjn,VAkn 为研究区域n中j,k两种类型商品交易市场的成交额;VAn为研究区域n中所有类型商品交易市场的成交额。当研究区域中的商品交易市场类型个数为1时,不采用该计算公式,专业化指数为1。

2.空间关联规则。Agrawal等于1993年首先对顾客交易数据中购买物品之间的关联问题进行研究,提出了关联规则的概念,并给出了相应挖掘的算法。Koprski K对传统的关联规则进行了拓展,并成功地将其引入了空间数据挖掘领域。从此诸多地学工作者和区域经济学家对空间关联规则挖掘进行了大量的研究,主要包括概念,挖掘过程,挖掘算法等。这些基础性的研究工作大大地促进了空间关联规则在各领域中的应用。空间关联规则是通过蕴含表达式来进行描述,如AB(c%,s%)。A和B是交集为空(A∩B=φ)的谓词集合,且二者中至少包含一个空间谓词。s%,是规则的支持度,指A和B在所有空间事务中同时发生的概率,P(A∩B)。c%,规则的可信度,指在所有空间事务中A发生的前提下B发生的概率,P(B/A)。非空间谓词,指常规的逻辑谓词。空间谓词是包含空间关系的逻辑谓词。除了可信度和支持度,很多学者还开发出了其他的指标对空间关联规则进行衡量。蕴含表达形式直观、简单、明了。如规则,is-a(x,house)∧close-to(x,urban center)is-expensive(x)(100%,95%)。该规则表明:95%靠近市中心的房子价格都高,该规则的正确率为100%。

3.邻域专业化空间滞后。一个研究区域的商品交易市场专业化的水平不但与该区域中的经济因素有关,而且还受到其邻域商品交易市场专业化程度的影响。本文中通过专业化指数滞后来反映邻域专业水平对当前研究区域商品交易市场专业化的影响。专业化指数滞后计算公式如式(2)所示。

(2)

S是邻域亿元商品交易市场专业化指数空间滞后,N是研究区域的邻域个数,pn和λn分别是第n相邻区域的专业化指数和相应的权重。

三、亿元商品交易市场区域专业化关联分析

1.亿元商品交易市场区域专业化计算。关联规则分析要求数据表中的属性是离散的数值或符号。在进行关联分析之前,应该将连续的专业化指数转换成离散的专业化水平。本文将商品交易市场专业化划分成三个等级:高专业化水平,中等专业化水平和低专业化水平。下图展示了2005年各省区亿元商品交易市场专业化水平的分布情况。

说明:①(a)是亿元商品交易市场专业化指数(连续)分布图,(b)是离散化亿元商品交易市场专业化水平分布图②统计数据主要包括大陆省区亿元商品交易市场成交额数据。地区和港澳台地区没有统计数据,专业化指数设为0。③为统一数据,专业化计算过程中没有包含计算机市场、通讯器材市场和花卉市场。

连续型专业化指数可以更精确地表示商品交易市场的专业化水平,但是其不符合人们的思维习惯,比较抽象不易理解。离散型的专业指数很容易被人们接受和理解,但精度不是很高。由于关联分析的需要,我们需要将连续的专业化指数进行离散化处理。

2.亿元商品交易市场区域专业化关联因素分析。关联规则分析可以发现专业化水平和区域其他因素之间让人感兴趣的关联知识。关联规则的支持度反映该规则在挖掘数据中的覆盖度;可信度反映规则的正确度。在对挖掘规则没有限制的情况下,会有大量的关联规则成为挖掘结果,但其中只有很小的一部分是有意义的。最小置信度和支持度分别设置为80%和10%。除了规则模版、最小支持度和置信度,我们通过专业知识对的挖掘结果进行分析评估来得出最终有意义的关联规则,如表1所示。

结合中国亿元商品交易市场的专业背景知识,这里我们得到了3条有用的规则。它们的支持度和置信度分别在14%和81%以上。其中第一规则说明:如果一个地区的城市化水平中等,第二产业占所有产业的比重高,市场化水平低,人口密度低,高速公路密度低,该地区的亿元商品交易市场专业化是中等水平,该规则的支持度是14.29%,置信度是90%。

四、讨论与结论

商品交易市场专业化影响因素是分布于一定的区域空间中,具有属性信息和空间信息,且相互之间存在一定的相关性。由于空间信息的存在和统计独立性假设的无法满足,从而使得传统的分析方法无能为力。空间关联规则可以反映要素的空间、非空间信息之间的关系,适合进行商品交易市场专业化关联分析。空间关联规则分析要求数据表中的数据项是离散的,然而专业指数和影响因素数据都是连续的。连续数据离散化是空间关联分析的第一步工作。上图显示了2005年中国亿元商品交易市场省区专业化指数连续值和离散值的空间分布情况。通过对比我们可以发现:连续数据表达更精确;离散数据表达更易理解。上表显示了空间关联分析获得的强关联规则。在指定的最小置信度和最小支持度下,我们只能获得后件为商品交易市场专业化是中等水平的关联规则。不同的关联规则前件,对应的置信度和支持度也各不相同。连续数据离散化是关联分析前最为重要的数据处理过程。不同的离散化方法得到的离散化结果存在很大的差异,最终影响关联分析的结果。本文中采用的等距离离散化方法将所有连续数据转换成三个等级的离散值:高、中和低。由于专业化指数和影响因素的连续数值集中于一个很窄的数据范围内,从而导致了离散化后数据集中于中水平等级。如最终的挖掘结果所示,所有强规则的后件都是专业化水平中,其他两个等级为后件的规则都被最小支持度和可信度过滤掉了。同时缺失数据的插值算法和统计数据本身的精度对离散化的结果也有着重要的影响。商品交易市场专业化是衡量一个地区所有商品交易市场的经济总量在各类交易市场之间的集中程度,其反映了经济总量的一种分布模式。基于前人的研究基础,作者给出了商品交易市场专业化指数的计算公式。空间关联规则被用于对商品交易市场专业化与其影响因素之间关联分析,如最后分析结果所示,我们得到了三条有趣的关联规则。这些规则可以用来预测一个地区商品交易市场专业化的水平,也可以为商品交易市场的规划与建设提供决策支持。

注:张雪伍为通讯作者

参考文献:

[1]任兴洲:我国商品批发交易市场的发展现状与趋势[J].经济纵横, 2000, (8): 26~27

[2]王克臣李敏:入世五年我国亿元商品交易市场快步走过[J].数据, 2007, (7): 28~30

[3]杨松:北京商品交易市场的发展模式及管制方式 (一) [J]. 中国市场, 2007, (30): 24~27

上一篇:从“囚徒困境”现象谈企业竞争情报及价格战中... 下一篇:阿拜经济思想在当代的理论意义和社会价值