对网络舆情监测系统框架的探究

时间:2022-09-17 07:54:26

对网络舆情监测系统框架的探究

[摘 要]21世纪以来,互联网在很大程度上改变着人们的日常生活,通过互联网传播信息,速度快,影响范围广,因此网络舆论的力量越来越强大,针对这一情况,相关政府部门应加大对网络舆情监测的重视程度,通过引进先进监测技术与理念,创新监测框架等方式,动态监测舆情变化,建立健全舆情监测体系,创建良好和谐的网络环境,更好地为人们服务。本文以网络舆情监测系统发展研究为基础,重点探究构建系统模块的框架,并详细阐述其关键技术。

[关键词]舆情监测;系统框架;网络环境;模板功能

中图分类号:TP391.1 文献标识码:A 文章编号:1009-914X(2016)15-0306-01

2016年1月22日,CNNIC(中国互联网信息中心)我国第37次《互联网发展状况统计报告》,该报告中指出,截止到2015年底,我国网民的总数量已经达到6.88亿,年增长率为6.1%,计算机、互联网在国内的普及率超过50.0%,数据表明我国互联网的普及速度较快,手机、电脑等移动终端已逐步覆盖于人们生活,只要在有网的情况下,人们接收、传播信息的速度将会变得更快。极大程度改变人们沟通交流方式的同时,也对网络舆情监测提出了更高要求。

1.网络舆情监测系统发展研究现状

互联网是一个全开放型的交流平台,与传统媒体相比,传播信息的速度更快,同时人们也可通过微博、论坛、贴吧等平台,成为传播信息的主体,这也加速了网络舆情的形成。受到网民素质、网络环境等因素的影响,网络中仍存在很多不良消息,如暴力、恐怖等,如果被某些不法分子利用,将会造成极大的网络动态,导致社会中存在不稳定因素。因此,相关政府必须加大对网络舆情监测的重视程度,采取针对性解决措施,为网民创建更安全的环境。

网络舆情监测工作在国际中发展历程较长,最为传统的监测手段一般采取手工操作,以人工方式为基础,通过员工监测指定页面的方式,检索出页面中重点监测词汇,从而寻找出最新的舆情动向。随着互联网的飞速发展,该种监测技术已经不能适应大量信息的需求,基于此,TDT研究项目产生,其核心内容包括话题追踪、监测、报告及关联监测等。

2.构建系统模块框架

构建网络舆情监测系统框架,需要广大技术人员与政府机构共同努力,结合我国网民实际需求,不断健全系统监测模块,营造良好的网络环境。从监测过程及程序的角度分析,其框架本质为获取收集数据、整理数据、依据不同用户要求分析,整个系统模块的构造如图1所示[1]:

2.1 收集数据模块

收集数据模块是网络舆论监测系统框架最基础的模块,主要发挥着获取网络信息的功能,具备全天候不间断收集、自动收集等特点,既可收集整个网络也能指定网络进行收集。在收集的过程中,应注意以下两方面的事项,一是尽可能获取最为全面的数据,保障数据的完整性与原始性;二是提升数据收集的准确性与可靠性,所有被收集的数据应尽量符合网络用户关注的舆论热点,满足以上两个条件后,才能更好地进行舆情预处理与分析。

当前,收集数据的方式主要有以下两种:一是网络爬虫技术[2],HTML协议作为互联网中基本协议,以URL(统一资源定位符)为基础,将互联网中绝大部分资源联系起来,形成一个完整的整体。而网络爬虫技术是指从预先设置好的URL列表出发,按照顺序对列表中页面进行访问并获取数据,并通过分析页面中其他URL,并智能选择出符合系统要求的URL,将其放到待访问队列,通过遍历式访问,搜查限定范围,更为精准的获取数据;二是元搜集技术,搜索引起是大多数用户进入网络的途径,随着互联网技术的飞速发展,提供搜索引擎的服务商越来越多,通过对不同的搜索引擎设置元搜索的方式,从而更为广阔的收集不同引擎间的数值,该种技术构建简单,且数据获取准确率较高。

2.2 预先处理数据模块

网络页面中存在的数据较多,且具有自身特点,包括描述与内容两种,属于半结构化形式的数据,如果直接对已获取的数据进行分析,将会增加其分析难度,因此,需对数据进行预处理,主要包括以下两个步骤:首先,提取网页中热点内容,从噪音中摘取出用户关注的新闻或者其他内容,并将其转化为HTML标签树[3],并建立出对应的提取规则;其次,进行文本分词环节,对于页面中获取的连续、非结构性文本进行对应处理,使其更加规范化。

2.3 整理数据模块

整理分析数据模块是系统框架中最为核心的模块,具备主题聚类、发现热点、等方面的功能。基于主题聚类而对角度分析,聚类能够更为直观的展示新主题,并将整理过后的内容归结到同一特征的空间中;发现热点主要是指发现人们舆论关注点,在互联网的时代背景下,网络中的舆情主题无时无刻不在变化,而舆情监测系统能够将热点问题从诸多主题中科学选择出来,并合理推送到舆情分析工作人员手中。整理数据模块的过程中,工作人员应注意填写好网络舆情监控登记表,具体模块内容如表1所示:

2.4 呈现结果模块

呈现结果模块主要是为科学展示网络舆分析,并为决策提供参考依据,经过分析的结果能够更为简单的传递到决策工作人员手中,其具备以下几方面的功能:查询所有针对性主题;推送最新网络主题;警告拐点或舆情热点;舆情发展变化情况等。

3.结束语

综上所述,随着计算机技术的飞速发展,人们对互联网的依赖程度越来越大,因此,相关政府机构须加大对舆情监测系统的重视程度,结合网络信息传播特点,遵循监测系统运转程序,即收集数据、预处理数据、整理数据、呈现结果数据,在这个过程中,应从以下两方面展开工作。首先,对于收集数据而言,应尽量拓宽监控网页种类,通过搜集社区网页、论坛数据的方式,更广泛、全面的获取专业网络舆论数据;其次,对于分析、决策舆情而言,须以数据挖掘、语言处理等技术为前提,加入自动摘要、热点搜索、智能搜索等用户高级需求,进一步扩展舆情报警等功能,创建出更为和谐的网络环境。

参考文献

[1] 董天策.网络公共事件研究的符号学路径――《网络公共事件:符号、对话与社会认同》序[J].新闻研究导刊,2015,22:200+189.

[2] 谢贵春,冯果.信息赋能、信息防险与信息调控――信息视野下的金融法变革路径[J].北方法学,2015,06:38-48.

[3] 陈宏伟.基于微博的高职院校大学生网络舆情预警系统的设想[J].物流工程与管理,2015,11:323-324.

上一篇:高职英语教师职业倦怠现状调查及对策 下一篇:浅析双向减震器在钻井中的应用