基于K―means算法的电子政务用户细分模型研究

时间:2022-10-23 02:26:07

基于K―means算法的电子政务用户细分模型研究

[摘 要] 在系统阐释电子政务发展阶段的基础上,将CRM及其客户细分理念引入电子政务领域,构建用户细分模型,并进行实证分析,结果表明,细分结果能够为个性化服务的实现创造条件。

[关键词] 电子政务 CRM 客户细分 K―means算法

一、引言

经过多年建设,我国的电子政务已取得了巨大的成就,围绕关系国计民生的大事要务,围绕企业和社会公众的实际需求,政府网站发挥了积极而明显的作用。从公共服务的角度,我国电子政务经历了按部门提供服务、按用户对象或应用主题提供服务的发展阶段,当前,迎来了个性化服务的发展阶段,要求充分以用户需求为依据提供个性化服务。

而大多数电子政务网站提供的都是面向所有服务对象的通用服务,缺乏特色和针对性,满足不了广大用户多样化的需求。要解决这一矛盾,首先需要在充分了解用户需求的基础上,对用户进行细分,才能针对细分群体提供个性化服务。因此,本文将CRM及其客户细分理念引入电子政务领域,借鉴CRM主要的聚类算法K―means算法,构建用户细分模型,对用户进行细分。

二、电子政务的发展阶段及面临的问题

1.电子政务的发展阶段

所谓电子政务,就是公共管理部门应用现代信息和通信技术,将管理和服务的一项项具体业务通过网络技术进行集成,在互联网上实现组织结构和工作流程的优化重组,超越时间、空间与部门分隔的限制,全方位地向社会提供优质、规范、透明的管理和服务。

从公共服务的角度,我国电子政务主要经历了三个发展阶段。

第一阶段是从政府职能的角度提供服务,即以机构设置为依据提供服务,例如将服务按照部门分类。这一阶段提供服务的主要特点有:(1)服务可用性低。在电子政务建设初期,大多数政府网站都按照部门提供服务,用户只有了解政府机构职能,才能选择部门进入相应的服务窗口。(2)服务易用性低。大多数网站按照部门提供服务,使得办事程序重复、繁琐,用户需要访问多个部门网站,由原本跑多个衙门转变为在网站上访问多个网站,服务的易用性大打折扣。(3)服务效果差。由于电子政务建设初期缺乏部门业务协同,导致办事效率低下,几乎无法发挥在线服务的高效性。

第二阶段是从用户对象的角度提供服务,即以应用主题或用户对象为依据提供的一站式服务,例如按照婚姻生育、教育就业等应用主题或者企业、个人等用户对象分类。这一阶段提供服务的主要特点有:(1)服务可用性大大提高。按照应用主题或者用户对象提供服务的方式,大大降低了用户接受服务的难度,用户从单一的政府网站入口能够获取政府相关的信息和服务。(2)服务易用性有待提高。虽然按照应用主题或者用户对象对服务进行了初步分类,但是并没有结合用户需求对服务事项进一步细分,因此,用户进入相应的主题,面对数量庞大的事项往往无从下手。(3)服务效果明显提高。这一阶段的电子政务开始注重跨部门合作,业务协同得到加强,能够把不同的政府职能部门通过网络集成在一起,让公众享受“一站式”服务,有效地提高了服务效率。

第三阶段是从用户特定需求的角度提供服务,即充分以用户多样化的需求为依据提供的个性化、定制化服务,例如将用户进一步细分为农民、老幼病残等群体。汪向东、姜奇平将这一阶段称为全面响应型电子政务,是指在任何时间和任何地点对全部政务需求包括公民个性化需求的全面响应。我国已经迎来个性化服务的发展阶段。这一阶段提供服务的主要特点有:(1)服务易用性大大提高。进一步实现“以公众为中心”和无缝隙的公共服务。用户能够在网站上方便地实现所有与政府打交道的事务,个性化需求得到满足。政府在此阶段才真正由原本的分散结构转变为一体化的网上政府,由原本的管理主体转变为服务中心。(2)服务效果大大改善。个性化服务阶段的电子政务最大限度地实现了电子政务的核心价值――为用户提供高认知度、高满意度的公共服务,使政府职能转变的目标与满足用户实际需求的建设工作高度统一。同时,改善和提高了政府形象与效能――电子政务真正体现政府管理方式创新的重要成果,展示建设社会主义“和谐社会”的重要成就。

2.当前电子政务面临的问题

电子政务是给任何人、任何社会群体提供公共服务,服务对象具有多层次、多样性的特点,存在面向用户需求和目标不同的差异,如何根据用户特定需求有针对性地提供个性化的公共服务,是目前我国电子政务面临的最大问题。要解决这一问题,首先需要对用户群体进行细分。本文借鉴CRM的核心理念及其客户细分思想,尝试对电子政务用户进行细分。

三、CRM及其对电子政务的借鉴意义

1.CRM的基本内涵及客户细分

CRM是一种“以客户为中心”的企业商务战略,强调个性化定制、实现“一对一”营销和服务,目的是使企业根据客户细分进行重组,强化使客户满意的行为,从而改善客户的满意程度并提高企业的利润。核心理念就是倡导从“以产品为中心”转向“以客户为中心”的企业经营理念和运作模式,通过完善的客户服务和深入的客户分析来满足客户的个性化需求。

CRM的核心方法是“个性化”的营销管理和服务。所谓客户细分是指根据客户的价值、需求和偏好等综合因素对客户进行分类,并提供有针对性的产品、服务和营销模式的过程,分属于同一客户群的消费者具备一定程度的相似性,而不同的细分客户群间存在明显的差异性。

早期的客户细分方法主要有定性的经验描述法和定量的传统统计法。随着客户的需求、行为、偏好等因素随着市场的变化越来越快,客户细分的过程应该是一个动态的过程。客户动态细分的实现方式要靠K―means算法等数据挖掘技术,细分结果更符合市场的动态变化。在市场分析中,通过聚类分析能帮助决策者识别不同特征的客户群以及客户群的行为特征。

2.对电子政务的借鉴意义

目前大多数电子政务网站提供的都是面向所有服务对象的公共服务,缺乏特色和针对性,无法满足用户个性化需求。将CRM的核心理念及“个性化”的客户细分思想用于指导电子政务建设实践,对电子政务用户进行细分,能够满足用户个性化需求。对于每一个具体的用户,不管是个人还是企事业机构,由于其个体特征、知识结构等自身特点,以及所处的社会环境的不同,对政府服务都具有不同的需求。如:同是买房,不同的人由于收入水平的差别其购房类型、付款方式都会不同。因此,对用户进行细分是电子政务个性化服务发展阶段的迫切要求。

四、电子政务用户细分模型的构建

已有的电子政务用户的分类方法都是基于经验和一些描述性统计结果对用户进行粗略的分类,在电子政务用户分类领域缺少科学的分类算法。本文首次将CRM主要的聚类算法K―means算法应用到电子政务用户细分领域,构建用户细分模型。

1.K―means算法基本原理

K―means算法以欧式距离作为相似性测度,它是求对应某一初始聚类中心向量V=(V1,V2,…,VK)T最优分类,使得评价指标JC值最小。算法常采用误差平方和准则函数作为聚类准则函数,误差平方和准则函数定义为:S={x1,x2,…,xn}。其中,Mi是类Ci中数据对象的均值,p是类Ci中的空间点。

K―means算法是一个最优化求解问题,目标函数存在着许多局部极小点,只有一个是全局最小点。目标函数的搜索方向总是沿着误差平方和准则函数减小的方向进行。不同的初始值使得聚类中心向量V沿着不同的路径使目标函数减少。目标函数分别沿着VA、VB、VC三种不同的初始值向量的路径逐步减小,分别找到各自对应的最小值。其中,只有B点对应的最小值才是全局最小点,而A、C两点对应的最小值是局部极小点。

K―means算法采用迭代更新的方法:在每一轮迭代中,依据k个聚类中心将周围的点分别组成k个簇,而重新计算的每个簇的质心(即簇中所有点的平均值,也就是几何中心)将被作为下一轮迭代的参照点。迭代使得选取的参照点越来越接近真实的簇质心,所以目标函数越来越小,聚类效果越来越好。

2.电子政务用户的细分模型构建

K―means的目标是根据输入的参数k,将数据划分成k个簇。算法首先随机选取k个点作为电子政务用户对象的初始聚类中心,然后计算各个用户对象的样本到聚类中心的距离,把样本归到离它最近的用户聚类中心所在的类;对调整后的新类计算新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数JC已经收敛。在每次迭代中都要考察每个用户样本的分类是否正确,若不正确,就要调整。在全部样本调整完后,再修改聚类中心,进入下一次迭代。如果所有的样本被正确分类,则不会有调整,聚类中心也不会变化,这标志着JC己经收敛,算法结束。该算法框架如下:

(1)给定大小为n的数据集,令I=1,选取k个初始聚类中心Zj(I),j=1,2,3,…,K;

(2)计算每个数据对象与聚类中心的距离D(xi,Zj(I)),i=1,2,3,…,k,如果满足D(xi,Zk(I))=min{D(xi,Zj(I)),j=1,2,3,…,k},则xi∈wk;

(3)计算误差平方和准则函数JC:

(4)判断:若则算法结束;否则I=I+1,计算k个新的聚类中心,,返回(2)。

K―means算法的步骤

K―means算法

算法K―means (s,k),{xi}ni=1,xi=(xi1,L,xip,L,xis)

Input:n个数据对象集合xi

Output:k个聚类中心Zj及k个聚类数据对象集合Cj

Begin

m=1

initial k prototype Zj,j∈[1,k]

repeat

for i=1 to n do

computer

if D(xi,zj)=min{D(xi,zj)} then

end

if m=1,then

m=m+1

for j=1 to k do

End

当考察完所有数据对象后,一次迭代运算完成,新的聚类中心和JC值也计算出来。如果在一次迭代前后,JC值没有变化,说明算法己经收敛,即准则函数JC作为算法是否结束的依据。在迭代过程中,JC值逐渐减小,直到它的最小值为止。图2显示了K―means算法的迭代过程。这个算法需要的时间复杂度为0(tknd),其中t是算法循环的次数,t

五、实证分析

以下面的实例对上述模型进行实证分析,验证细分模型的有效性,得到细分结果。本文针对当前城镇居民最为关心的住房问题进行研究,对有住房需求的城镇居民以家庭为单位进行细分。

1.细分属性选择及数据准备

不同家庭具有不同的收入水平、家庭资产、风险偏好等,这些都是影响购房方式的重要因素,因此,本文初始选取了包括family population(家庭人口)、income(人均年收入)、family assets(人均家庭资产)、marriage(婚姻状况)、venture preference(风险偏好)、housing area(人均住房使用面积)、intention(购房目的)7个细分属性,以描述有住房需求的家庭的不同类型,选择北京市城八区的家庭调研数据集的20876条数据进行验证,得到部分数据的视图如下表所示。

2.K―means聚类分析

对上述属性进行相关性分析之后去除部分属性,得到income(人均年收入)、family assets(人均家庭资产)、housing area(人均住房使用面积)3个属性,本文选取K=5,随即选择5个对象代表5个类的均值,进行聚类分析,得到最终的聚类中心和类的分布,如下表所示。

由此可见,将有用户对象细分成了以下5类:住房困难群体,人均年收入、人均家庭资产、人均住房使用面积均符合廉租房申请条件的家庭;购房困难群体:人均年收入、人均家庭资产、人均住房使用面积均符合经济适用房申请条件的家庭;潜力购房群体:未达到经济适用房的申请条件,由于收入水平和家庭资产的限制,目前选择租房;主要购房群体:达到结婚年龄,并且有能力买房的主要房产需求群体;住房升级或购房投资群体:经过多年的财富积累,有住房升级的需求或者买房投资。

3.聚类效果评价

采用无指导和有指导方法评价上述K―means算法的聚类效果,结果如表所示。

从上表可以看出,K―means算法得出的类内距离均小于0.1,说明得到的用户群的类内特征相似,而类间距离均大于0.1,说明得到用户群的类间区别明显。

4.细分结果分析

住房困难群体,是廉租房的保障对象,针对此类用户群体应提供廉租房的申请条件、办理流程等服务,并且可将用户在服务过程中遇到的常见问题整理汇总,优化服务内容和方式;购房困难群体,是经济适用房的保障对象,应提供经济适用房申请条件、办理流程等服务;潜力购房群体,主要选择租房的形式,可提供租房的流程等服务,由于这类群体经济水平提高之后相应会有购房需求,可提供相关的前期准备服务;主要购房群体,可提供贷款申请、公积金使用等服务,此外,这类群体在购买住房之后,往往会有买车的需求,可同时提供买车的相关服务;住房升级或购房投资群体,由于其购买的往往是第二套及以上住房,应提供第二套及以上住房的购买政策和流程等服务,这类群体在住房升级之后,可能会有车辆升级的需求,同样可提供买车服务等。

六、结论

本文将CRM及其客户细分理念引入电子政务领域,构建了用户细分模型,并通过实证研究得到细分结果,在分析结果的基础上,能相应地提供个性化的政府服务,满足细分群体的特定需求。实践中电子政务用户数量巨大,若更大范围的选取用户数据,利用细分模型进行细分将得到更接近实际的分类结果。本文建立的细分模型与基于经验的现有细分方法相比,由于引入了客户细分理念和K―means算法,使得细分更加科学合理,且能够随着用户需求的变化进行动态的调整,不断提高服务的针对性。

参考文献:

[1]2006年中国政府网站绩效评估报告[R].中国软件评测中心,2007

[2]李广乾:电子政府与电子政务一理想与现实的关系[M].2002

[3]汪向东等:电子政务的行政生态学理论、方法与策略研究[R].中国社会科学院,2006

[4] 2007年中国政府网站绩效评估报告[R].中国软件评测中心,2008

[5]杨路明 巫宁等:客户关系管理理论与实务[M].北京:电子工业出版社,2004

[6]段尧清 费奎明:个性化电子政务信息服务模式[J].情报杂志,2007年第6期

[7]TonyBain等著 邵勇译:SQL Server 2000数据仓库与Analysis Services[M].电力出版社.2003

[8]Vance Faber. Clustering and the Continuous K-means Algorithm

上一篇:考试经济背后的哲学思考 下一篇:由“环评风暴”看我国建设项目环境影响评价机...