基于因子聚类分析的专利综合评价研究

时间:2022-08-15 03:30:55

基于因子聚类分析的专利综合评价研究

〔摘 要〕对广东省21个城市进行地区专利综合评价,为达到数据简化、客观赋权、区域间比较的功能,采用文献调查法选取地区专利综合评价指标24个,并结合广东省知识产权局的专利统计信息的基本数据,再在此基础上进行因子分析,将多项指标聚合为新的因子,并用提取、计算出的6个主因子得分进行系统聚类分析,得出广东省各市专利综合实力的分类。该研究帮助相关人员了解地区专利的优势和不足,从而为地区专利发展提供决策支持。

〔关键词〕因子分析;聚类分析;数据挖掘;专利评价

〔中图分类号〕G250.252 〔文献标识码〕A 〔文章编号〕1008-0821(2012)09-0172-06

工业革命之后,世界上的创新发明越来越多,而专利的诞生,是为了保证发明人的创造活动得到一定量的回报,以激励更多的发明研究工作。1624年英国颁布了《垄断法》,这是早期专利制度的雏形,我国也于1985年颁布了《专利法》[1]。我国经济经过30多年的发展,目前正经历着从劳动密集型向高科产业型的方向发展,而判断是否转型成功的标尺之一就在于专利的发展状况,专利是企业或国家在各种竞争中取得优势的关键因素。广东省一直处于全国经济发展的前沿,但各地之间的专利发展情况不均,为了能找出地区间的差距并有针对性地采取措施,对广东省各地区的专利综合评价应客观、全面、科学,为此,本文选用目前较为权威、科学的专利评价指标体系,在此基础上对广东省2010年的专利统计数据进行因子分析和聚类分析,以期有效促进广东省各地区专利水平的提高和发展。

1 专利评价指标体系

对专利评价指标体系的选用也是对专利综合实力进行评价的一个关键步骤,专利评价指标是相对于原始数据的二次数据,用来进行分析的二次数据是否准确、客观、全面,影响着分析结果的好坏。

我国专利制度实施得比较晚,对专利指标的研究还处于初期阶段,目前的研究热点不仅仅只注重专利数量,同时也重视专利质量以及专利综合评价,如黄庆[2](2004)等的《专利评价指标体系——专利评价指标体系的设计和构建》,肖国华等[3](2008)《专利分析评价指标体系的设计与构建》,张冬梅[4]等(2006)《专利情报分析指标体系——分析方法与技术》,阮梅花[5]等(2011)《企业自主创新能力评价的专利指标体系构建初探》等等,结合国外Huang Z[6]的研究来总结以上所有文献,本文在选取专利评价体系遵循以下几个方面:

(1)较客观、科学、全面、准确地表现我国在世界上、我国不同地区或者各个行业乃至企业的专利综合实力;

(2)“量”和“率”结合的平衡。“量”指的是总量,用来评价总体实力情况;“率”用来评价相对强度情况。

(3)实用并具有指导性。

最终,本文选取的地区专利综合评价指标由表1所示:

2 专利综合评价的方法

在进行数据分析之前,首先对本文运用的因子分析、聚类分析进行介绍和说明。

2.1 因子分析法

因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法,基本思想是:根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构——即公共因子[7]。即用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相关,各指标代表的信息不重叠。根据因子分析的目的得知,综合指标应该比原始变量少,但包含的信息量应该相对损失较少[8]。

因子分析的基本原理[9]是:选择i个主分量Z1,Z2,……,Zi,其中Zi=ai1*F1+ai2*F2+……+aim*Fi+ε,F1、F2 、…、Fi称为公共因子,ε称为以Zi的特殊因子,aim是第i个变量在第m个因子上的负荷,它一方面表示Zi对Fi的依赖程度,绝对值越大,密切程度越高;另一方面也反映了变量Zi对公共因子Fi的相对重要性,把aim称为因子荷载。该模型中的因子载荷矩阵需要用适当的方法进行估计,使得各个公共因子之间相互独立;然后,分别计算出公共因子Fi的得分:F=f1*Z1+f2*Z2+……+fi*Zi,fi作为每个主分量Zi的方差贡献率的权数(即因子得分系数)。最后利用此综合评价函数进行综合评价,即以每个因子的方差贡献率占因子总方差贡献率的比重作为权数进行加权计算综合得分。

本文使用因子分析的主要目的是可以通过因子分析对各因子进行客观赋权,以便确定综合评价的重要因素——权重,权重反映不同评价指标对地区专利的影响程度大小,引入权重的综合评价可以更科学合理地评价地区专利发展状况。

2.2 聚类分析法

聚类(Clustering)就是将数据分组成为多个类(Cluster),在同一个类内对象之间具有较高的相似度,不同类之间的对象差别较大,聚类分析师一种无监督数据挖掘方法,它基于观测之间的相似度或距离将观测(数据)分组[10]。一个好的聚类方法会产生高质量的聚类结果,使同一类别内的观测相似度高,而不同类的观测差异大。

3 专利综合评价的实证分析

本文选取了广东省21个市作为样本,并对样本进行因子分析与聚类分析。样本数据根据广东省知识产权局网站2006-2010年的专利统计报表计算得出,其中主要数据来源于2010年,个别数据根据2006-2010年统计计算得出,计算与统计过程使用EXCEL与SPSS统计分析工具完成。

3.1 基于因子分析的实证研究

(1)采用SPSS因子分析统计得出公因子特征值与贡献率表以及公因子得分系数矩阵如表1、表2所示:

按特征值大于1的原则提取公因子,最终提取了6个公因子,第一个公因子的特征根为11.108,解释了总变异的46.285%,以此类推,6个公因子的累积贡献率达91.425%,信息损失为8.575%,能较为全面地反映信息。

上一篇:地方政府治理创新中的民间组织 下一篇:“转向”的“艰难”:革命语境下成仿吾的文学...