基于大数据的智慧政府门户建设分析

时间:2022-09-15 08:17:30

基于大数据的智慧政府门户建设分析

摘 要: 在对国外智慧政府门户网站研究和实践进行回顾的基础上,基于中国政务网站智能分析云中心提供的82家中国政府网站用户访问行为大数据集,对政府网站用户需求的时空变化规律、主题分类等进行了分析,并从网站页面优化、服务流程优化和栏目体系优化三个层面分别介绍了基于热力图、漏斗图、需求相似度分析等数据挖掘技术开展政府网站服务优化的方法和案例。

关键词: 大数据; 智慧城市; 智慧政府门户; 用户行为分析

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2017)05-79-04

The construction of intelligent government portal based on big data

Wang Qingchun, Feng Su, Shan Hongxia, Xu Yongfei, Zheng Yanling, Xu Bing

(General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China, Beijing 100088, China)

Abstract: The paper analyzes the temporal and spatial variation rules of the users' needs of the government website, the subject classification based on the research and practice of foreign intelligent government portal, and 82 Chinese government website user access behavior large data sets provided by China Government Website Intelligent Analysis Cloud Center. And from the three respects of web page optimization, service process optimization and column system optimization respectively, the paper also introduces the methods and cases of government website service optimization with the data mining techniques based on thermogram, funnel graph and demand similarity analysis.

Key words: big data; smart city; government portal wisdom; behavior targeting

0 引言

前,“智慧城市”已成为信息化时代城市治理和社会发展的新模式、新形态。智慧政府门户的基础是大数据应用[1]。其重要的意义在于用数据创造更大的公共价值,形成政民融合、互动的互联网治理新格局。

本文在回顾发达国家基于大数据提升智慧政府网站服务能力方面成功经验的基础上,结合国家质检总局和国家信息中心近年来围绕大数据分析、服务优化等领域的探索与实践,介绍了政府网站的大数据分析技术及其应用案例。

1 现有的研究与实践

国外研究者普遍认为[2],以用户为中心,提供高质量、差异化的在线服务已经成为全球政府网站发展的基本特征[3]。基于数据分析来研究用户需求,提出优化方案,成为国外政府网站建设与管理研究的重要议题之一[4]。即近几年来政府网上公共服务分析工具的技术创新,开始朝向基于云模式采集用户行为数据、应用大数据分析平台开展用户行为挖掘的模式[5]转变。

首先,美国、英国、澳大利亚、日本等发达国家政府门户网站和联合国门户网站均已部署了基于云服务模式的网站用户行为分析系统。

其次,发达国家还高度重视相关研究机构和专业团队的建设。美国早在数年前就成立了美国联邦政府网站管理者委员会网站量化分析分会[6]。

第三,通过应用先进的网站分析技术,发达国家政府网站能够有针对性地改进政府网站服务。如英国政府要求政府网站必须收集访问量、页面浏览量等数据,并在此基础上网站运行情况的评估[7]。

2 本文研究的数据来源

本文使用的政府网站大数据集合主要来自中国政务网站智能分析云中心所提供的基础数据。为确保政府网站所属机构隐私信息不被泄露,本文对涉及具体网站的信息做匿名化处理,仅保留研究所需要的基本内容。

截至2014年6月,中国政务网站智能分析云中心已为1800多家政府网站提供数据分析服务。在具体研究中,本文选择了较有代表性的82家政府网站进行了统计分析。数据分析时段为2013年1月1日至2013年9月30日。原始数据采集总量约5000万条。

3 基于大数据分析感知用户需求

3.1 政府网站用户需求的时空变

3.1.1 政府网站用户需求的时间演化分析

不同月份中用户需求热点主要与以下两方面的因素密切相关:一是中央推出的重大举措、重要改革、重要会议、重要政策等;二是各月份发生的节庆活动、重大灾害、公共事件等与群众日常生产生活关系密切的事件。

笔者曾对某农业政府部门网站上,用户对于“玉米”及其相关服务需求主题在一年时间内的变化情况进行了分析。

其中,关于“玉米除草”类关键词,其用户需求主要集中在玉米的播种期,因此对于玉米除草和病虫害防治等信息关注较多。关于“玉米价格”类关键词需求,主要集中在9月份前后。

通过上述分析可看出,农业政府网站用户的需求信息与农业生产活动规律高度相关,并且呈现出动态变化的特征。

3.1.2 政府网站用户需求的地域差异分析

笔者以82家样本政府网站为对象,分析了三类不同地域用户在各项基本需求分类中的差异性。如图1所示。

从图1可以看出,本地用户更加关心当地的知名企业、政府机构、行政地名和重要人物等信息。省外用户和国外用户对于文化旅游词的需求明显高于省内用户。此外,非中文关键词的主要用户群体是海外用户,对于提升网站国际影响力具有重要作用。

中国的不同地域用户对于同类服务的需求存在显著差异性。不同地区用户对于农产品类政府网站信息服务需求的差异性与农业生产的地域分布规律高度吻合。这提示我们,政府网站需设计面向不同地域用户的服务频道,从而有效提高政府网站服务的智慧化和个性化水平。

3.2 政府网站用户需求的主题分类

3.2.1 用户站外搜索关键词语义分类框架

⑴ 人名职务词

人名职务词主要包括三类:

第一类是职务职称词,通过人工梳理的方式总结了党政机构和公共机构的常用职务职称的后缀词库;

第二类是名人姓名词汇,课题组手工收集了政治人物、历史名人、文化名人词、当代社会知名人士等姓名信息共28122条;

第三类是常见人名词。

⑵ 公务公文词

公务公文词库包括四类:

第一类是公文及相关文体结尾词;

第二类是公务员日常工作相关词;

第三类是与公务员思想建设相关的关键词;

第四是公务员日常专题工作相关词。

⑶ 办事服务词

办事服务词库包括三类:

第一类是办事动作词;

第二类是办事客体词;

第三类是办事事项词。

⑷ 政府机构词

所谓政府机构词,即与政府部门和事业单位相关的关键词。通过对全国各级各类部、委、办、局、厅、处等政府机构名称及缩写词的梳理,构建了政府机构后缀词词库。

⑸ 其他机构词

所谓其他机构词,主要包括以下几类:

第一类是经营性单位词,即以诸如公司、茶城、咖啡厅等为后缀的词;

第二类是事业单位词,即以诸如医院、文化活动室等为后缀的词;

第三类是著名企业品牌词,即以诸如家乐福、肯德基、沃尔玛等知名品牌中文名称为后缀的词。

⑹ 文化旅游词

文化旅游词的提取方案包括以下三种:

第一种,全国的4,781条著名名胜古迹名称,采用全文匹配的方式提取关键词,如峨眉山、青城山等;

第二种,是提取具有共性的景点结尾词,采用结尾匹配的方式提取关键词,如科技馆、冰雪世界等;

第三种,是提取旅游活动内容的关键词,采用结尾匹配的方式提取关键词,如垂钓、采摘等。

⑺ 地名区划词

首先,提取地名区划词的共性结尾,采用结尾匹配的方式提取关键词,如社区、街道、镇、乡等;

其次,收集全国寸以上行政区划名称,并采用全文匹配的方式提取关键词。

⑻ 非中文词

提取用户输入站外搜索关键词中不包含任何中文字符的关键词,并纳入这一类别。

3.2.2 政府网站用户站外搜索关键词的主题分类

通过对82家样本政府网站数据统计分析,将目前我国政府网站站外搜索关键词的主题划分为八类。分布情况如图2所示。

⑴ 政府机构名称词。这类用户搜索关键词实际上对应的用户行为是通过搜索引擎访问政府网站首页并继续查找相关信息,尽管比例很高,但其并不能直接反映用户的需求主题,需结合其来到政府网站之后的点击流行为加以分析。

⑵ 公务公文词。这类用户搜索关键词背后所对应的用户群体很多情况下以公务员用户居多。

⑶ 办事服务词。这类关键词最能够反映社会公众对于政府网上公共服务的真实需求。

4 基于大数据分析优化网站服务

4.1 网站页面设计优化:热力图分析技术

所谓点击热力图,就是按该页面用户鼠标点击行为的频次、位置等基本信息,并对页面上每一个像素所吸引鼠标点击次数的多少绘制色彩,从多到少依次为黄色、橙色、红色、蓝色和白色,能够非常直观地反映用户需求热点的分布情况。以下以国家质量监督检验检疫总局网站首页的“在线服务”栏目的热力图分析为例,介绍基于热力图分析工具优化网站页面设计的基本思路。

第一步,选择办事事项大类方式,包括按业务类别、使用对象、审批方式和办理机构四类。

第二步,选择办事事项小类,如业务类别分类下又包含了产品质量监督、通关等10类办事事项。

第三步,选择具体事项名称,总局网站默认提供了4条入口。

第四步,可以点击“more”按钮,查看该小类下的所有办事事项列表。

为考察上述国家质检总局网站在线服务栏目的四个步骤用户使用情况。下图显示了国家质检总局网站首页“在线服务”栏目的热力图分布情况:

可以看出,步骤2点击比例为8.25%,步骤3点击比例为2.02%。只有25%的人点击了具体办事事项名称;从热力图上看,步骤4“more”按钮的点击也仅为0.24%,说明大量用户可能在选择完服务事项小类之后就流失了。

可能有两点原因:一是“more”按钮字体过小,位置不醒目,容易被忽视,二是从用户角度看,从步骤1到步骤4,体现了用户使用该栏目的基本行为路径;而目前设计中,步骤4反而跑到了步骤3的前面,这不符合用户浏览网页的习惯,因此这种设计难以被大多数“粗心”的用户发现,导致大量用户流失。

在发现上述用户体验问题之后,质检总局网站将步骤4的“more”按钮改为 “更多服务事项”,使其更加容易被中文用户接受;同时,按钮字体样式改变,使其更加醒目;将步骤4的位置挪到了步骤3之下。

自调整之后,质检总局网站在线服务栏目访问人次有了显著上升。

4.2 网站服务流程优化:漏斗图分析技术

一个完整的政府在线服务的网上办事环节,在一定程度上类似于电商网站的购物流程。根据路径转化漏斗图,政府网站监测者可以直观了解每一步业务流程的实现率、流失率,并可以对漏出的部分用户进行多维度数据分析,优化办事流程的设计。以某地方旅游局网站上提供的景区门票在线购买流程为例,5.17%的用户从首页来到了购物车页面,70.31%的用户在购物车页面选择继续浏览下一页面,而在付款页面中,94.52%的用户顺利完成了门票购买交易。

图5也可以看出,从购物车页面到确定订单页面的用户流失率较高,为29.69%。如果这部分用户停留时间过长,说明在这一环节中比较迷茫,需要提示;如果停留时间过短,说明办事步骤可能存在让用户走不下去的情况。经过进一步分析发现,流量损失的原因在于注册和登录环节,很多用户觉得过于繁琐,而在该环节选择了漏出。

4.3 网站栏目体系优化:需求相似度分析技术

成都政府网站曾引入多维尺度分析工具,对网站中的相应栏目进行了调整[8]。

栏目需求相似度分析,是通过判断两个栏目的用户群体实际需求的重合程度,并对比其在实际功能定位和内容主题上的差异性,根据不同情况提出对策的研究方法。有以下两种情况:

⑴ 栏目A和栏目B分别从属于不同的大厅栏目,并且其政务属性具有明显分别,但两个栏目的用户需求高度相似,对于这类栏目,应当在彼此之间增加深度链接机制,以方便用户在两个栏目服务之间切换;

⑵ 栏目A和栏目B分别从属于不同的大厅栏目,其政务属性没有明显差异,两个栏目的用户需求高度相似。可以考虑通过栏目合并的方式,突出网站的特色服务,形成拳头产品。

对成都市政府门户网站政民互动的二级栏目需求相似度进行分析,结果如下。

政府信箱、市长信箱、市民话题三个栏目的用户需求高度相似,说明用户对于上述三个栏目的政务属性差异并不理解,而是倾向于将其视为同一类服务使用。因此建议将政府信箱和市民话题栏目合并入市长信箱栏目。

听证会栏目用户群体需求与其他栏目差异明显。该栏目的无效关键词主题十分散乱。说明此类用户是因为主题相似而被“误导”到网站上来。为此,可以建议成都网站在听证会栏目中,增加“相关信息”链接,有效增加用户黏度。

5 结束语

本文结合课题组近年来对政府网站大数据分析和政府网站服务优化方面的实践探索,介绍了当前我国智慧政府门户建设过程中应当着重解决的技术问题和应用案例。希望本文研究,能够为中国智慧城市建设研究者和从业人员提供有益借鉴。

参考文献(References):

[1] 于施洋,杨道玲,王Z璇,张勇进,王建冬.基于大数据的智慧政府门户:从理念到实践[J].电子政务,2013.5:65-74

[2] Pieter Verdegem, Gino Verleye.User-centered E-Government in practice: A comprehensive model for measuring user satisfaction[J]. Government Information Quarterly,2009.

[3] United Nations. United Nations E-Government Survey 2010:Leveraginge-government at a time of financial and economic crisis[R/OL]. New York,2010.12.25.

[4] European Commission. 8th e-Government Benchmark Measurement:European Commission Directorate General for Information Society and Media Smarter, Faster, Better eGovernment[R/OL],2009.

[5] Avinash Kaushik.精通Web Analytics 2.0――用糁行目蒲

与在线统计艺术[M].清华大学出版社,2011.

[6] Web Metrics/Analytics Community[EB/OL]. http://www.howto.gov/communities/federal-web-managers-council/metrics

[7] 姚国章.英国电子政务发展案例[J].电子政务,2005.Z6.

[8] 王建冬,于施洋.基于用户体验的政府网站优化:动态调整栏目[J].电子政务,2012.8:28-34

上一篇:操作系统课程多角度教学改革探索与实践 下一篇:教育云在教育信息化发展中的应用