数据可视化在大数据时代中的应用探究

时间:2022-06-08 10:41:34

数据可视化在大数据时代中的应用探究

【摘要】随着大数据时代的来临,数据挖掘和分析的发展已具有相当重要的现实意义。用户对数据进行分析的需求增长, 数据可视化的要求也会变得愈发强烈。能有效呈现出用户需要的数据, 并易于理解进而帮助用户做出决策的数据可视化技术将在当前及未来大有作为。本文描述了当前数据可视化的时代背景,主要应用,并表明其作用与注意点,揭开数据可视化在现代社会的作用。

【关键词】数据可视化;大数据;商业智能;数据挖掘

1.时代背景

自21世纪以来,数据爆炸已是人类的重大挑战,人们淹没在数据海洋中,却对信息,知识极其缺乏,人类分析数据的能力与获取数据的能力相差甚远。同时,数据的多态、高维、获取的动态性、数据关系的异构更增加了数据使用的难度。在传统企业占据主流地位的关系型数据库有越来越多无法进行管理的数据。这类数据的量巨大,具有多样性,如各类文本、图像、视频、传感器信息,且数据产生和更新的频率上升到一个新层次。总结下即为海量化(Volume),多样化(Variety),快速化(Velocity),这三点为大数据的主要特征。人们要从海量非结构化数据中挖掘有用信息的这种推力,使大数据技术正逐步代替传统信息管理技术。伴随着推力巨大的互联网,大数据时代的大幕正逐步拉起。而在这发展过程中,能有效呈现多元化数据, 便于决策的数据可视化便越来越引起关注。

2.数据可视化的作用

在信息科学与知识管理中,DIKW(Data,Information,Knowledge,Wisdom)体系作为最基础的模型,在数据处理流程中完成从数据到智慧的转化。人们急切的需要能展示演绎数据的工具,并且能够传达数据身后真正的知识与智慧的工具。在整个转化过程中,可视化于沟通,传递,表达方面表现出明显的优势。

数据可视化运用计算机图形学,图像处理等技术,并以其在视觉感知与人脑认知上的优势使美学因素融合在数据分析中。优秀的数据信息图甚至可以达到艺术的层面,令人赏心悦目。其在数据处理流程中持续的优势,使数据可视化交互工具市场逐步做大。

数据就是石油,传统的各类领域中不被重视的数据重新归纳总结会释放出巨大潜力。新闻中的数据信息可以归纳为信息图表,再与其他新闻进行分析整合,人们往往可以从中有收获。政府机关的数据通过有效整理并进行可视化,可以增加其透明度,民众可以更容易获取有效信息。企业数据可视化,可以对整个企业运营流程有很好的掌控,便于管理与盈利。网络数据及公共资源的潜在价值也极大,各类社交网站开放的API可以供开发研究人员挖掘人们生活消费习惯,甚至可以通过文本分析并进行可视化发现流行病的爆发趋势,购物网站对用户已购货物记录进行地域偏好分析,也可获得有价值的情报。

3.主要应用

3.1 文本可视化

将文本信息提取技术与可视化相结合的文本可视化可以辅助用户将文本中的信息简洁地呈现出来。原始文本经过文本信息挖掘,视图绘制和人机交互,这便是基本的可视化流程。在诸多网站上,文本可视化的标签云技术已越来越常见,其为基于关键词的最简单的文本可视化技术,用颜色和字体的大小体现关键词于文本中的分布差异,衍生的Wordle技术改进了空间布局,提升了美学效果。在进行信息检索时,也可以使用TileBar,Sparkler等可视化方法来提升检索效果。除此之外,文本信息中还包含了大量的人类主观信息,可以在RSS新闻内容,社交平台中挖掘用户情感倾向信息,帮助调查者从宏观角度进行分析并为决策提供依据。

3.2 多媒体数据可视化

大数据时代,人们早已对半结构化数据及非结构化数据充满了好奇。图像,视频,音频中的数据价值推动了多媒体数据的可视化。比如社交照片中群体成员之间的关联多使用了海赛图方法;视频的可视化则经常使用将图像堆叠成立方的方法,为抽取视频中的运动信息提供方便;音乐的可视化如今也多是媒体播放工具的一个功能。

3.3 商业智能的数据可视化

如今的大量在线商业数据具有强烈的跨媒体特征与丰富的时空地理属性,用户的消费日志包含了大量个人信息,这些都催生了该领域的可视化发展。当前商业智能的数据分析大多借助于OLAP的多维分析模式实现,采用可视化技术进行数据探索。从最早的柱状图、饼图、网状图等简单图表,发展到呈现公司状态与商业环境的仪表盘、子弹图,新成长的技术能有效地传达数据背后的知识和思想。同时随着Tableau,Spotfire等软件的推广,可视化极大推动商业智能的大众化,降低了普通人进行数据分析的门槛。

3.4 Web端可视化

Web端的可视化是通过HTML,CSS,Javas-cript技术,在网页上实现可交互的可视化作品及时全面显示信息。Web端的可视化可以提升用户效率,使选择操作更加方便,感官更加舒服。D3.js就是一套面向Web的数据可视化的Javascript库,具有极大的设计灵活性和可移植性。国内开发的DataV.js同样出色,可以便捷的调用且兼容各类浏览器。

4.数据可视化的注意点

可视化虽然是非常好的了解数据的方式,不过也很容易以错误的方式执行从而背离了其价值所在。为充分展示信息而不顾图表的整体协调,想要包含更多的信息效果却适得其反,这样做很容易使图表缺乏美感。有限的仪表盘空间要包含的是重要的且值得优先考虑的数据,且当图表显示过多的信息时,过于紧密的布局很容易显示出错误的信息。而另一种错误则是为了追求画面的美观,却使数据内容的表达不佳。所以在可视化的过程中,目标的确立是最为基本的,专注于自己的目标有助于更好地传递表达数据,同时与图表的美观之间也能达到一种平衡。

真实的数据往往需要占用大量时间进行规范化,特征选择,维归约等预处理操作,数据集的清洗与规范化或许是实践中占最多时间的部分,此点不容忽视。同时,数据可视化是一种辅助分析的工具,非分析工具,正常的处理流程还要借助传统的统计手段及其他专业的知识。总而言之,数据可视化作为一种对数据信息进行专业化处理的优秀工具,其理论与技术将在未来获得逐步提升,最终一定会对商业社会及科研领域的发展作出重大贡献。

参考文献

[1]涂子沛.正在到来的数据革命:大数据[M].桂林:广西师范大学出版社,2012.

[2]陈为,沈则潜,陶煜波.数据可视化[M].北京:电子工业出版社,2013.

[3][美]Nathan Yau著,向怡宁译.鲜活的数据――数据可视化指南[M].人民邮电出版社,2012.

上一篇:基于iSchool云教育平台中小学“定制家教”学习... 下一篇:我国信息化测绘技术体系建设探讨