大数据时代分析范文

时间:2024-01-02 17:26:29

大数据时代分析

大数据时代分析篇1

[关键词]大数据时代;数据分析理念;分析

[DOI] 10.13939/ki.zgsc.2015.22.074

在传统的商业运作模式中,在运营过程中对自身经营发展的分析只停留在数据的简单汇总层面,缺乏有效地对客户网络、业务范围、营销产品、竞争对手优劣等方面进行深入解析;而在当今大数据时代,通过所接收的大量内部和外部数据中所蕴含的信息中透露的市场弹性,可以预测市场需求,进行分析决策,从而制定更加行之有效的战略发展计划。“大数据”是一个量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库T具对其内容进行抓取、管理和处理。在当今信息时代,很多企业用户在实际应用中把多个数据集放在一起,已经形成了PB级的数据量;数据类型广,数据来源种类多,且数据种类和格式日渐丰富,囊括了半结构化和非结构化数据,早已打破传统的结构化数据范畴,如何在大数据时代背景下进行科学有效的数据分析这需要加强对市场的了解,对泡沫经济的规避,了解数据所传递的信息真假。

1 数据化决策的兴起与运用

在大数据时代,信息之间的爆炸增长,使得各种信息传递非常之快,只需要拿起网络终端就可以了解到地球另一边发生了什么。文字、图形、影像都化作数据流在网络中以电信号的方式传递着信息。数据流在传递各行各业的信息同时形成了渗透于各行业的核心资产和创新驱动力。在大数据时代,企业所拥有的数据集合规模及数据的分析和处理能力决定着企业在市场中的核心竞争力。

因此通过数据分析进行决策渐渐成为新的分析理念,例如,在支付宝上进行对电影票房的投资,这些投资通过对导演往期作品和演员的表演张力,及投资方的选角等数据进行分析,预测电影的票房,选取投资可获利的电影,进行票房投资,从而获取票房分红。我国的石油油田根据地震技术的收集数据,进行科学统一规划的分析处理,形成对地下油田的分析建模,能够有效直观地展示地下油藏的分布情况,从而选择油井的开采点。中国人民银行通过对人民币汇率的涨幅,进行数据分析,来制定符合中国国情的外汇货币政策,对货币进行宏观调控,这能够有力的保护人民币升值时,在国际贸易市场中国进出口贸易所面临的压力。在大数据时代背景下,通过直觉和经验进行决策分析的优势不断下降,在商业、政治及公共服务领域中,通过对大数据进行数据分析从而做出符合时代背景的决策,已成了目前的潮流。

2 数据分析理念及方法

(1)数据分析要引入统计学思想。在大数据时代背景下,传统的抽样分析已经并不适用于对大数据的分析中,在大数据时代应当要转变思维,转变抽样思想,样本就是总体,要分析与某事物相关的所有数据,而不是依靠少量数据样本,这样才能够在最大限度地明白事物发展变更过程,能够对数据所表露的信息进行更好地处理。要更乐于接受数据的纷繁芜杂,不再追求精确的数据,这并不是说其严谨性降低了,而是往往不起眼,不符合常理的数据更能够反映实际的情况。通过对数据网络之间的联系进行分析,不再探求难以捉摸的因果关系,通过数据的分析处理更能够反应数据的变更。这些想法都与统计学相关通过所收集的数据,进行有效的分类处理,能够更好地反应事物的变化,更有利于做出决策。

(2)数据分析流程。在实际的数据分析过程中,因大数据贯穿区域较广,在地域和行业之间穿插交错,颠覆了传统的线性数据收集模式,而形成了颠覆传统的、非线性的决策基础,这种决策方式要求我们通过对数据进行收集,将各行各业所收集的基本信息,转化为数据,将数据经过初步的整合分类,做出符合当地当时的数据信息,将数据进行深层次的技术处理,将处理过后的信息化为知识,运用到实际的决策中去。在大数据时代,数据的积累并不会贬值,而且还会不断增值,为了更全面、深入地了解研究对象,往往需要对数据进行整合,这就使得数据的积累尤为重要。

(3)数据分析对统计学的意义。在大数据时代背景下数据分析理念能够有效地对数据流进行合理地分类处理,进行科学的统计行为,统计与分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,这就意味着所有有用的数据信息均来源于数据分析处理之后的结果。大数据的数据分析理念扩宽了统计学的研究范围,而不仅仅只是实现数据的对比,而是从根本上丰富了研究的内容,如:一些实时性需求会用到EMC的Creen-Plum、Oracle的Exadata,以及基于MySQL的列式存储In-fobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop,满足大多数常见的分析需求,对传统的统计T作有着四个转变。统计研究过程的转变,使统计过程成为收集与研究。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,统计研究T作思想的转变,数据的收集不断增加,信息的录入不断升级,其对系统资源,特别是1/0会有极大的占用。这就使得能够更好地进行数据分析处理决策。

3 数据分析过程中注意事项

3.1数据分析要明确变量

将数据收集进行处理是为了明确市场中的某一个变量意义,这就使得在进行数据分析的时候要能够明确地找寻变量存在前后所发生的变化,通过数据对比可以知道该变量在大数据的市场中所存在的影响因素。是否对市场有着风险或有利于市场的开发利用,能够在数据分析后做出合理决策。

3.2统计中不再追求精确的数据

大数据时代下,数据的不精确性不仅不会破坏总体信息可靠性,还有利于进行剥丝抽茧,从而了解总体情况。大数据时代,越来越多的数据提供越来越多的信息,也会让人们越来越了解总体的真实情况。错综复杂的数据能够反映数据之下到底是泥潭还是机遇。数据之间传递的信息良莠不齐,如果要一一追求准确性不利于统计工作的开展,因此可以将个别的异常值剔除。大数定律告诉我们,随着样本的增加,样本平均数越来越接近总体,这就使得样本与总体的差异性很小,更加符合实际情况。

4 结论

大数据时代分析篇2

引言

目前人类每年产生的数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别,随着数据量的急剧增长,大数据时代已经到来。

随着计算机处理技术和云计算的迅速发展,人们处理大规模复杂数据的能力日益增强,从大规模数据中提取有价值信息的能力日益提高。经营管理、工业生产等数据都可以直接从互联网中提取并存储到服务器中,然后进行数据挖掘和分析,对于提高企业经营管理水平,进行生产过程控制,提高生产效率发挥着巨大的作用。

数据是德国工业4.0五大特色之一。数据是信息化时代重要的生产要素,数据生产信息,信息改善决策,进而提高生产力。可以预测,未来数据积累量、数据分析能力、数据驱动业务的能力将是决定企业价值的最主要因素,是评价企业价值的核心。

一、大数据时代的数据分析

1.大数据

大数据是维克托?迈尔-舍恩伯格在2008年的著作《大数据时代》中提出的概念。维基百科给出的定义是,大数据指所涉及的资料规模巨大,无法通过目前常规软件工具,在合理时间内达到撷取、管理、处理、整理成为有用信息的数据集合。

大数据的主要特征为大量性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)。

(1)大量性。是指大数据的数据量巨大。在大数据时代,个人电脑、手机、平板电脑等网络工具的使用和高度发达的网络技术的普及,数据资料的来源范围在不断拓展,数据的计量单位从PB到EB到ZB,数据量增长发生了质的飞跃。

(2)多样性。是指数据类型繁多。大数据不仅包括传统的以文本资料为主的结构化数据,还包括信息化时代所有的文本、图片、音频、视频等半结构数据和非结构化数据,且以半结构化和非结构化数据为主。

(3)高速性。指大数据处理时效性高。大数据产生速度快,有价值信息存在时间短,时效性强,在海量的数据面前,处理数据的效率关乎数据是否有使用价值,因此,能迅速有效的提取大量复杂数据中的有价值信息显得非常重要。

(4)价值性。指大数据价值巨大,但价值密度低。大数据中存在反映人们生产、生活、商业等各方面极具价值的信息,但由于大数据规模巨大,数据时时刻刻都在更新变化,这些有价值的信息可能转瞬即逝。因此,如何通过强大的机器算法迅速高效地完成数据的价值“提纯”成为大数据时代亟需解决的难题。

2.大数据时代

大数据时代是指在大量数据信息基础上所形成的新型信息时代,是建立在通过互联网、物联网等现代网络渠道广泛大量数据资源收集基础上的数据存储、价值提炼、智能处理和展示,促进数据发挥价值的信息时代。大数据时代,数据分析过程中数据的管理和应用效率得到提高,人们几乎能够从任何数据中获得可转换为推动人们生活方式变化的有价值的知识。大数据时代的发展会促进众多领域和行业进行变革,会对人们未来生活产生深刻的影响。

3.数据分析

数据分析是指用合适的统计方法及与分析对象有关的知识,定量与定性相结合,对收集到的大量数据进行分析的过程,是为了提取有用信息和形成结论而对大量数据进行详细研究和概括总结的过程。数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息挖掘和提炼出来,进而总结出研究对象的内在规律。

数据分析在企业经营管理中具有重要意义。企业通过统计调查、整理获得的统计资料能够对客观对象的数据特征取得一定的认识,但只是停留在表面的初步认识。通过数据分析,挖掘数据背后隐藏的信息,总结隐藏在其中的内在规律,掌握事物的本质及内在的发展规律,将其应用到实际的经营管理中,可以帮助管理者进行合理的决策管理,并且及时调整企业的运营发展策略,使企业的各项管理工作不断改善和提高。

目前常用的数据分析方法有:

老七种工具,即排列图、因果图、分层法、调查表、散步图、直方图、控制图;

新七种工具,即关联图、系统图、矩阵图、KJ法、计划评审技术、PDPC法、矩阵数据图。

4.大数据时代的数据分析

从大数据中挖掘隐藏的有价值信息的关键在于对数据进行正确的数据分析,数据分析是大数据处理流程的核心。大数据的价值产生于分析过程,从规模巨大的数据中挖掘有价值信息所进行的分析过程就是大数据分析。

大数据分析和传统数据分析最重要的区别在于数据量。数据量的急剧增长及大数据的特征,决定了数据的存储、查询以及分析的难度增加,对数据处理技术的要求迅速提高。大数据分析建立在海量原始数据基础上,不需要预先设定研究目的和方法,而要从大量数据中通过数据挖掘技术找到数据之间的关系并建立模型,寻找导致现实情况的根源因素,甚至形成理论和新的认知,在此基础上对未来进行预测和优化,以实现社会运行中各个领域的持续改善与创新。

传统的数据分析是“向后分析”,分析的是已经发生的情况。而在大数据时代,数据分析是“向前分析”,具有预测性。传统的数据分析主要针对结构化数据,具备一整套行之有效且?V泛使用的分析体系:利用数据库存储结构化数据构建数据仓库构建数据立方体进行分析。对于从大数据中提炼更深层次更有价值的信息的需要促使数据挖掘技术的产生,并发明了聚类、关联分析、分类、回归分析、估计、预测、描述和可视化等一系列行之有效的方法。同时大数据的到来使得在线数据分析成为可能,如Web页挖掘、OLAP等。数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,用于指导以后的行动。

二、大数据分析在企业经营管理中的意义

在企业的经营管理过程中,数据是关键且核心的因素,在关键环节进行科学的数据分析,对于提升企业的经营管理能力具有十分重要的意义与作用。

首先,对企业情况进行完整客观的反映。在收集企业全面数据报表、调查资料的基础上,利用数据分析工具进行严谨的分析,形成科学规范的数据分析报告,能发现数据背后的信息,便于理解、阅读和利用,为企业发展决策提供参考。

其次,对企业运营情况进行有效监督。监督是数据分析在企业经营管理中的一项十分重要的功能。对企业经营管理过程中所产生的数据进行监督具有十分重要的作用。在对企业数据、资料进行收集整理的过程中,能够相对较为全面、如实地知晓行业动态及本企业运行发展状况,能够对企业的相关活动产生的效果进行了解,比如企业方针政策实行与否、经营计划落实情况、经济指标完成情况等,从而进行行业对比和横向、纵向对比分析,以帮助企业良性发展。

第三,参与科学化决策。对收集整理到的数据资料有针对性的进行深层次地研究、分析,挖掘出数据资料潜在的实质涵义,促使企业管理者及相关部门能够更为完整客观地了解企业发展现状及发展方向,从而能够更有针对性地进行企业决策,计划制定,起到数据分析在企业经营管理中的参与科学化决策的作用。数据驱动型决策是大数据时代决策的特点:尽可能全面、完整综合地收集数据,在此基础上使用恰当的统计方法进行建模和分析,挖掘出数据背后的关系,预测事件发生的概率。企业利用大数据和数据分析进行决策时,首先要提高对数据的重视程度,转变思维模式,在遇到重大决策时,先进行数据收集、分析,再进行决策。其次,要重视普通员工日常积累的数据。员工在完成日常工作的同时,积累了大量最基础数据资料,企业将所有日常的数据加以整合分析,可以在决策时起到关键重要的作用。再次是建立数据辅助决策的流程和模板,建立基于决策任务的决策知识的收集、创造、共享、传递和激励机制。

三、大数据分析在工业生产过程中的应用探讨

随着信息化的推进,数据已经成为一种重要的资源。未来大数据和数据分析将在工业生产全过程中进行应用,将大力提升企业内部运营管理效率,提升企业竞争力,同?r提升制造过程中的智能化。

信息技术随着信息化与工业化的深度融合,已经渗透到了工业企业产业链的各个环节,ERP、MES等技术在工业企业中得到广泛应用。工业企业中生产线高速运转,工业设备产生大量数据,工业领域所拥有的数据日益丰富。基于大数据分析平台,对这些数据进行分析,总结经验、发现规律、预测趋势、辅助决策,充分释放和利用海量数据资源中蕴藏的巨大价值,优化公司运营结构,精准决策,降低成本,提高效率。

大数据和数据分析的应用将给工业企业带来创新和变革的新时代。信息化和工业化的深入融合,给工业领域带来深刻的变革,通过互联网、物联网等带来的低成本感知、高速移动链接、分布式计算和高级分析,给工业发展带来了更快的速度、更高的效率和更高的洞察力。大数据分析在工业领域的应用主要包括产品创新、生产流程优化、产品质量管理、生产计划制定、产品定价、产品生命周期管理、库存管理、供应商管理等各个方面。

1.产品创新。客户与工业企业之间的交易产生大量的行为动态数据,同时对产品的使用情况跟踪记录,产生产品使用动态数据,对这些数据进行挖掘和分析,将分析结果使用到产品改进设计、创新等活动中,相当于让客户参与到产品的需求分析和产品设计等创新活动中,对产品创新具有不可估量的贡献。

2.生产流程优化。现代化的工业制造生产线安装有数以千计的小型传感器,在生产的全过程中可以探测温度、压力、振动和噪声等。整个生产流程将产生大量数据,对这些数据从不同角度进行挖掘分析、比如设备诊断、能耗分析、工艺分析等。在此基础上,对生产过程建立虚拟模型,仿真并优化改进生产流程,提高设备使用率、降低能耗、减少质量事故发生几率,优化工艺等,从而提高生产效率。

3.进行质量分析,提高质量管理水平。高度自动化的设备在加工产品的同时记录了庞大的检测结果。利用检测结果进行质量分析,可以提高质量管理水平。在产品的整个寿命周期,包括从市场调研到售后服务等的各个过程中适当运用数据分析过程,可以提高质量管理的有效性。例如QC工具在工业企业的应用。QC指质量控制。针对工业生产全过程特定的工作失误或品质不良运用QC工具展开分析讨论,并将结果可视化显示在大家容易看到的地方,提醒大家,防止再次发生同样的问题,同时谁有新的建议可以随时提出,大家一起讨论修订。

六西格玛也是目前企业质量管理中运用比较广泛的工具,它是一种用于改善企业质量流程管理的技术,它以“零缺陷”的完美追求,带动质量成本的大幅度降低。质量分析工具在广泛使用,可以提高产品质量,从而最终实现财务成本的降低,同时实现企业竞争力的突破。

4.产品故障诊断与预测。无处不在的传感器、互联网技术的利用,使得产品故障诊断实时进行,提高了产品故障诊断的及时性。利用数据挖掘与分析技术,对记录的数据进行建模与仿真,可以对产品故障实行动态预测。

5.生产计划的科学制定。生产环节的大数据具有很大的利用价值,对其进行挖掘与分析,对计划制定具有指导意义。通过对计划与完成的对比分析,发现计划与实际完成的偏差,在考虑产能约束、人员技能、物料供应、工装模具等生产资源的基础上,通过智能的优化算法,建立计划制定模型,从而制定更加科学合理的生产计划。

6.进行科学合理的产品定价。产品定价的合理性需要有详细的基础数据和试验数据作为支撑。一方面能够获取更加详细的微观数据信息,使产品成品的分析更加科学精确。另一方面可以研究客户对产品定价的敏感度。通过这些数据分析,为产品定价提供决策参考。

7.实现产品生命周期管理。随着物联网的发展,条形码、二维码、RFID等能够唯一标示产品,传感器、可穿戴设备、智能感知、视频采集、增强现实等技术能将产品生命周期的信息进行实时采集和分析,这些数据能够帮助企业在供应链的各个环节跟踪产品,收集产品使用信息,从而实现产品生命周期的管理。这些数据还可以用于售后服务,提高售后服务质量,从而提高产品竞争力。

8.库存管理。信息化高度发达,可以获取工业企业各方面的信息。库存信息将完全展现在管理者面前,通过数据分析和挖掘,可以准确知道产品原材料和产成品库存量。根据原材料库存量和生产计划确定原材料需求量,在此基础上进行采购,可以保证产品生产需求,有最大限度地减少了资源浪费。

9.完善供应商管理,实现准时化采购。在对原材料大量数据挖掘和分析的基础上,可以选择最合适的供应商,保证原材料质量和准时供应,产品质量得到有效控制,同时降低库存成本,增加了制造的敏捷性与柔性。

四、结语

大数据时代分析篇3

在采访中,首席信息官们总结出了5大影响他们进行分析的IT趋势。它们分别为:大数据的增长、快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。

1.大数据

大数据指非常庞大的数据集,尤其是那些没有被整齐的组织起来无法适应传统数据仓库的数据集。网络蜘蛛数据、社交媒体反馈和服务器日志,以及来自供应链、行业、周边环境与监视传感器的数据都使得公司的数据变得比以往越来越复杂。

尽管并不是每个公司都需要处理大型、非结构型数据集的技术。VeriskAnalytics公司首席信息官PerryRotella认为所有的首席信息官都应当关注大数据分析工具。Verisk帮助金融公司评估风险,与保险公司共同防范保险诈骗,其在2010年的营收超过了10亿美元。Rotella认为,技术领导者对此应当采取的态度是,数据越多越好,欢迎数据的大幅增长。Rotella的工作是预先寻找事物间的联系与模型。

HMS公司首席信息官CynthiaNustad认为,大数据呈现为一种“爆炸性”增长趋势。HMS公司的业务包括帮助控制联邦医疗保险(Medicare)和医疗补助(Medicaid)项目成本和私有云服务。其客户包括40多个州的健康与人类服务项目和130多个医疗补助管理计划。HMS通过阻止错误支付在2010年帮助其客户挽回了18亿美元的损失,节约了数十亿美元。Nustad称:“我们正在收集并追踪大量素材,包括结构性与非结构性数据,因为你并不是总是知道你将在其中寻找什么东西。”

大数据技术中谈论最多的一项技术是Hadoop。该技术为开源分布式数据处理平台,最初是为编辑网络搜索索引等任务开发的。Hadoop为多个“非关系型(NoSQL)”技术(其包括CouchDB和MongoDB)中的一种,其通过特殊的方式组织网络级数据。

Hadoop可将数据的子集合分配给成百上千台服务器的处理,每台服务器汇报的结果都将被一个主作业调度程序整理,因此其具有处理拍字节级数据的能力。Hadoop既能够用于分析前的数据准备,也能够作为一种分析工具。没有数千台空闲服务器的公司可以从亚马逊等云厂商那里购买Hadoop实例的按需访问。

Nustad称,尽管并不是为了其大型的联邦医疗保险和医疗补助索赔数据库,但是HMS正在探索NoSQL技术的使用。其包括了结构性数据,并且能够被传统的数据仓库技术所处理。她称,在回答什么样的关系型技术是经实践证明最好用的解决方案时,从传统关系型数据库管理出发是并不明智。不过,Nustad认为Hadoop正在防止欺诈与浪费分析上发挥着重要作用,并且具备分析以各种格式上报的病人看病记录的潜力。

在采访中,那些体验过Hadoop的受访首席信息官们,包括Rotella和Shopzilla公司首席信息官JodyMulkey在内都在将数据服务作为公司一项业务的公司中任职。

Mulkey称:“我们正在使用Hadoop做那些以往使用数据仓库做的事情。更重要的是,我们获得了以前从未用过的切实有用的分析技术。”例如,作为一家比较购买网站,Shopzilla每天会积累数太字节的数据。他称:“以前,我们必须要对数据进行采样并对数据进行归类。在处理海量数据时,这一工作量非常繁重。”自从采用了Hadoop,Shopzilla能够分析原始数据,跳过许多中间环节。

GoodSamaritan医院是一家位于印第安纳州西南的社区医院,其处于另一种类型。该医院的首席信息官ChuckChristian称:“我们并没有我认为是大数据的东西。”尽管如此,管理规定要求促使其存储整如庞大的电子医疗记录等全新的数据类型。他称,这无疑要求他们要能够从数据中收集医疗保健品质信息。不过,这可能将在地区或国家医疗保健协会中实现,而不是在他们这种单个医院中实现。因此,Christian未必会对这种新技术进行投资。

IslandOneResorts公司首席信息官JohnTernent称,其所面临的分析挑战取决于大数据中的“大”还是“数据”。不过,目前他正在谨慎地考虑在云上使用Hadoop实例,以作为一种经济的方式分析复杂的抵押贷款组合。目前公司正在管理着佛罗里达州内的8处分时度假村。他称:“这种解决方案有可能解决我们目前正遇到的实际问题。”

2.商业分析速度加快

肯塔基大学首席信息官VinceKellen认为,大数据技术只是快速分析这一大趋势中的一个元素。他称:“我们期待的是一种更为先进的海量数据分析方法。”与更为快速地分析数据相比,数据的大小并不重要,“因为你想让这一过程快速完成”。

由于目前的计算能够在内存中处理更多的数据,因此与在硬盘中搜索数据相比,其计算出结果的速度要更快。即使你仅处理数G数据,但情况依然与此。

尽管经过数十年的发展,通过缓存频繁访问的数据,数据库性能提升了许多。在加载整个大型数据集至服务器或服务器集群的内存时,这一技术变得更加实用,此时硬盘只是作为备份。由于从旋转的磁盘中检索数据是一个机械过程,因此与在内存中处理数据相比,其速度要慢许多。

Rotella称,他现在几秒中进行的分析在五年前需要花上一个晚上。Rotella的公司主要是对大型数据集进行前瞻性分析,这经常涉及查询、寻找模型、下次查询前的调整。在分析速度方面,查询完成时间非常重要。他称:“以前,运行时间比建模时间要长,但是现在建模时间要比运行时间长。”

列式数据库服务器改变了关系型数据库的传统行与列结构,解决了另一些性能需求。查询仅访问有用的列,而不是读取整个记录和选取可选列,这极大地提高了组织或测量关键列的应用的性能。

Ternent警告称,列式数据库的性能优势需要配合正确的应用和查询设计。他称:“为了进行区别,你必须以适当的方式问它适当的问题。”此此同时,他还指出,列式数据库实际上仅对处理超过500G字节数据的应用有意义。他称:“在让列式数据库发挥作用之前,你必须收集一规模的数据,因为它依赖一定水平的重复提升效率。”

保险与金融服务巨头JohnHancock公司的首席信息官AllanHackney称,为了提高分析性能,硬件也需要进行提升,如增加GPU芯片,其与游戏系统中用到的图形处理器相同。他称:“可视化需用到的计算方法与统计分析中用到的计算方法非常相似。与普通的PC和服务器处理器相比,图形处理器的计算速度要快数百倍。我们的分析人员非常喜欢这一设备。”

3.技术成本下降

随着计算能力的增长,分析技术开始从内存与存储价格的下降中获益。同时,随着开源软件逐渐成为商业产品的备选产品,竞争压力也导致商业产品价格进一步下降。

Ternent为开源软件的支持者。在加入IslandOne公司之前,Ternent为开源商业智能公司Pentaho的工程副总裁。他称:“对于我来说,开源决定着涉足领域。因为像IslandOne这样的中等规模公司能够用开源应用R替代SAS进行统计分析。”

以前开源工具仅拥有基本的报告功能,但是现在它们能够提供最为先进的预测分析。他称:“目前开源参与者能够横跨整个连续统一体,这意味着任何人都能够使用它们。”HMS公司的Nustad认为,计算成本的变化正在改变着一些基础性架构的选择。例如,创建数据仓库的一个传统因素是让数据一起进入拥有强大计算能力的服务器中以处理它们。当计算能力不足时,从操作系统中分离分析工作负载可以避免日常工作负载的性能出现下降。Nustad称,目前这已经不再是一个合适的选择了。

她称:“随着硬件与存储越来越便宜,你能够让这些操作系统处理一个商业智能层。”通过重定数据格式和将数据装载至仓库中,直接建立在操作应用上的分析能够更为迅速地提供答案。

Hackney观察认为,尽管性价比趋势有利于管理成本,但是这些潜在的节约优势将被日益增长的能力需求所抵消。尽管JohnHancock每台设备的存储成本在今年下降了2至3%,但是消耗却增长了20%。

4.移动设备的普及

与所有的应用一样,商业智能正日益移动化。对于Nustad来说,移动商业智能具有优先权,因为每个人都希望Nustad能够随时随地亲自访问关于她的公司是否达到了服务级协议的报告。她还希望为公司的客户提供数据的移动访问,帮助客户监控和管理医疗保健开销。她称:“这是一个客户非常喜欢的功能。在五年前,客户不需要这一功能,但是现在他们需要这一功能了。”

对于首席信息官来说,要迎合这一趋势更多的是为智能手机、平板电脑和触摸屏设备创建适用的用户界面,而不是更为复杂的分析能力。或许是出于这方面的原因,Kellen认为这相对容易。他称:“对于我来说,这只是小事情。”

Rotella并不认为这很简单。他称:“移动计算影响着每一个人。许多人开始使用iPad工作,同时其它的移动设备正在呈现爆炸式增长。这一趋势正在加速并改变我们与公司内部计算资源交互的方式。”例如,Verisk已经开发了能够让理赔人在现场快速进行分析的产品,因此他们能够进行重置成本评估。他称:“这种方式对我们的分析产生了影响,同时也让每一个需要它的人随手就能使用。”

Rotella称:“引发这种挑战的因素在于技术的更新速度。两年前,我们没有iPad,而现在许多人都在使用iPad。随着多种操作系统的出现,我们正力争搞清楚其是如何影响我们的研发的,这样一来我们就不必一而再、再而三的编写这些应用。”IslandOne的Ternent指出,另一方面,为每一种移动平台创建原生应用的需求可能正在消退,因为目前手机和平板电脑上的浏览器拥有了更为强大的功能。Ternent称:“如果我能够使用一款专门针对移动设备的基于web的应用,那么我并不能肯定我将会对定制的移动设备应用进行投资。”

5.社交媒体的加入

随着脸谱、推特等社交媒体的兴起,越来越多的公司希望分析这些由网站产生的数据。新推出的分析应用支持人类语言处理、情感分析和网络分析等统计技术,这些并不是典型商业智能工具套件的组成部分。

由于它们都是新的,许多社交媒体分析工具可以作用服务获得。其中一个典型范例是Radian6。Radian6为软件即服务(SaaS)产品,近期已经被Salesforce.com所收购。Radian6是一种社交媒体仪表盘,为TwITter的留言、脸谱上的帖子、博客与讨论版上的帖子与评论中提及的特定术语以正负数显示,尤其是为商标名提供生动的直观推断。当营销与客户服务部门购买后,这类工具不再对IT部门有很严重的依赖性。目前,肯塔基大学的Kellen仍然相信他需要对它们高度关注。他称:“我的工作是识别这些技术,根据竞争力评估哪些算法适合公司,然后开始培训合适的人员。”

与其他公司一样,大学也对监督他们大学的声誉十分感兴趣。与此同时,Kellen表示,他可能还将寻找机会以开发专门用于解决学校所关注问题的应用,如监督学生入学率等问题。例如,监控学生在社交媒体上的帖子能够有帮于学校与管理人员尽早了解学生在大学里遇到的麻烦。Kellen称,目前戴尔已经做了这些工作,其产品支持公司探测人们关于故障笔记本电脑的推文。他称,IT开发人员还应当寻找一些办法将社交媒体分析得出的报警信息推送至应用中,以便于公司对相关事件快速做出反应。

Hackney称:“我们没有诀窍,也没有工具处理和挖掘海量社交媒体帖子的价值。不过,一旦你收集了数据,你需要有能力获取公司事件的充足信息,以将它们关联起来。”虽然Hackney称JohnHancock在这一领域内的努力还处于“起步阶段”,但是他认为IT部门将在公司数据的社交分析服务所提供的数据关联中发挥重要作用。例如,如果社交媒体数据显示公司在中西部地区的社会评论越来越负面,那么他将希望看一下如果公司在该地区就价格或策略进行调整是否会扭转这一负面发展趋势。

大数据时代分析篇4

关键词:大数据;图书馆;分析

近几年来,由于信息化技术的引领,大数据时代全面降临在全球范围内。数据是一种可利用资源,在各行各业中都存在有巨大的作用。因此,在大数据时代的背景下,关于如何高效地开发出数据的价值,是我国各领域中都应思考的问题。

1 针对大数据应用在图书馆中可能存在的问题的几点思考

1.1作为新兴技术,大数据技术还需经历时间的考验

微软企业中有位优秀的工程师曾说过,大数据时代还需经过10年以上的研究,人们才能熟练运用大数据技术获得真正的知识。而也有一位优秀的分析师指出,大数据技术的应用前景可能在2020年才会基本清晰,人们到那时就可以利用大数据技术做出最理想的决策。然而大数据技术的问题与其可靠性、隐性成本、易用性等有着直接关系。大数据的诞生是通过信息技术发展下而催化的产物。因此,大数据对信息技术依赖性非常强,若信息技术得不到充分的应用和发展,大数据也会受到严重的限制。

1.2无法正确掌握认识以及推广大数据的技术、概念、工具等的尺度

图书馆是一种公益型行业,是由国家政府主导的,所以在推动发展过程中,可能会遇到动力不足等问题,同时根据实际调查,国际化等级越高的行业受大数据技术的影响的程度越高,获得的绩效增长速度越快。然而除了国家图书馆外,还有以服务本地民众的单个图书馆,对此,在应用这一技术时,需要考虑大数据在单个图书馆中应用效果。同时民营性质的企业可能会为了求得长足的进步,而盲目地应用大数据技术,在投入大量的资源如设备、人员、后却收效甚微,没有获得显著成果。因此,在应用大数据技术时,应从自身条件出发,尽量做好引进、研发、调试等工作。

1.3继续开发与应用大数据技术和工具是否会拉大各区域的信息化差距

集中在国内经济发达地区的高等学校图书馆内率先应用大数据技术,必定能够提高图书馆的知识传递速度和用户的满意度,因此在服务水平上拉近与其它发达国家图书馆的差距的同时也拉大了与国内其它地区、类型图书馆的差距。因此,在加强与国际间图书馆的交流同时,还应做好大数据技术在D书馆的应用宣传和普及工作,与国内同行结合起来共同解决发展道路上可能遇到的问题。

1.4大数据时代人才稀少

大数据作为新兴的信息技术,其跨越的学科众多,操作难度非常大,对于人才的要求极为严苛,也因此导致大数据人才极为缺乏,这也是各国需要首要考虑的问题。我国图书馆应多与国际接轨,学习其它发达国家同行和其它行业的先进知识,积极培养国内的大数据人才,并加强大数据的普及和宣传,以引起国内同行的重视。同时图书馆界也应加大数据收集力度,开展数据监护活动的探索,努力分析用户的要求和使用规律,为数据监护人员开展工作提供基础信息。

2图书馆应用大数据技术后的数据处理与服务

2.1图书馆具备大数据的特征

由于用户需求的多样化以及图书馆建设信息资源平台的进度加快,图书馆存储的数字资源具备了“大数据”的一定特征。首先,图书馆内的数据资源种类有很多种,在光盘资源、网络资源、数据库资源中就具有音频、视频、图像、文字;服务系统中的日常读者信息和服务信息等;另外还有图书馆建设体系的数据等,一所普通图书馆所具有的数据量非常庞大以至于无法完全统一它们的编码方式、数据格式以及应用特征,形成了大量的异构数据。其次,图书馆的储存数据日益增加,资源总量庞大,通过实际统计,2009年底,国家图书馆的数字资源达到了190TB,到了2012年底,国家图书馆的数字资源总量已突破800TB。再次,随着编辑服务越来越个性化、学科服务专业化,用户的需求也在不断地多样化。因此,必须挖掘大数据的潜在价值,改进服务方法,才能提高用户满意度。最后,虽然图书馆的自动化水平已进入到新的发展阶段,且拥有大量的数据库记载和统计用户的信息和资源信息,但还需处理一些未进入数据库的异构数据,也许能发现新的服务方式。

2.2图书馆应用大数据技术后的数据处理方式

目前数字时代图书馆数据处理方式是将各种资源实现数字化、网络化以及语义化,通过建设数据库及语义化、创新服务方式等,最大程度的满足用户的需求和利用。然而大数据时代图书馆的数据处理方式出现根本性变化,如处理范围、对象、方式、目的等,通过分析提取服务数据进行分析和总结,了解用户的需求和使用规律,进而发现新的数据应用模式构建新的服务方法。同时大数据时代图书馆逐渐完成传统业务向数据分析、挖掘等新业务的发展,不再是仅依靠数据共享、丰富资源、增加时间等方式来提高服务水平,它还可以通过分析大量的数据,从中挖掘潜在的价值,以此提高高效、创新的图书馆服务。

2.3大数据时代图书馆的服务体系

随着技术的进步,以及用户的新要求,都在促使图书馆的服务体系发生变化,如服务模式、服务范围等都有了全新的改变。图书馆的服务模式是通过分析、组织、捕获大量的数据而总结出来的,因此,大数据时代图书馆的服务体系可能会跟着服务模式的调整而调整。随着调整如信息咨询、学科服务等图书馆服务模式,图书馆的服务范围必然会得到进一步的提高与扩大。未来,为国家机构、社会企业等提供数据分析、挖掘服务必然会是大数据时代图书馆的寻常服务内容。

3结语

随着信息技术的不断进步,大数据技术也进入到图书馆应用领域。大数据时代下,图书馆在大数据技术的支撑下,其服务方式、数据处理方式都有了根本性的改变,通过挖掘分析数据的潜在价值,以获得新的服务方式,进而最大程度的满足用户的需求。然而大数据技术应用过程中,可能产生的一些问题,都需要慎重考虑。在此,笔者建议在发展大数据时代图书馆的同时还应加强宣传和普及,并多参与国际、馆际间交流,共同努力合作解决大数据技术在图书馆应用中出现的问题,推动图书馆发展创新型服务。

参考文献:

[1]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012,04:120-122.

[2]张文彦、武瑞原,于洁.大数据时代的图书馆初探[J]. 图书与情报,2012,06:15-21.

大数据时代分析篇5

关键词:大数据;电网;营销管理

0引言

社会经济的整体发展,现代化的科技手段已经运用到方方面面,尤其是互联网的兴起,使得原来很多耗时耗力的工作都变得更加简单便利,通过应用到各行各业中进而影响到人民的生活水平。具体到电力行业中,在电网运营不断满足客户的需求过程中,产生了大量的客户使用数据,通过运用现代科技手段分析庞大的数据体量,可以为不同的客户提供更为精准的服务,满足不同客户的需求,并且通过了解客户的消费习惯进而对客户属性进行分析,为后期的其他营销活动进行铺垫和数据支撑。因此,基于大数据的电网营销管理分析是具有重要研究意义的课题。

1什么是“大数据分析”

“大数据分析”是基于现代科技发展而产生的一种分析技术,其主要是依靠于现代的科技手段,尤其是一些网络技术,通过对基础数据的整理分类,通过不同的计算机算法,可以将不同有类似特征的数据分列开来,最终在海量的数据中得到想要的数据分析。大数据分析技术被广泛应用于各种互联网行业,包括一些app、团购网站、搜索引擎等,通过对客户的日常网络浏览情况进行统计分析,掌握客户的偏好和实时的需求,进而能够更有针对性的为客户提供服务。大数据分析在互联网行业的广泛运用也引起其他行业的注意,纷纷引进其技术以期望可以在本行业中得到应用,最终为更好的掌握客户资源特性而努力,毕竟客户需求才能形成市场,才是供给企业存在的必要。

2“大数据分析”的算法

2.1神经网络

神经网络是可以针对电网营销数据进行加工训练,且是一个自我组织、自我适应的学习过程,可以学习到最具特征性的样本和数据区别能力,也正因为如此,神经网络的分析算法可以更好地获取有参考价值的海量的基本信息。神经网络是基于其自身的分布式的存储路径,并发的处理信息原理,其具有强大的计算能力和容错能力,能够通过练习掌握科学地调整不一样的神经网络参数的权值,进而更好的优化网络,并且适应外界的变化,抵抗不相干因素的干扰,最终适应使用者的需求来调节神经网络的分析能力,为使用者提供更好的服务。

2.2K近邻算法

此种算法是通过采用统计分析的方法,适用于各种分类问题中。具体是指:根据一个已经限定好的训练集,针对准备被分类的数据样本,通过在训练集中寻找与相关样本最为邻近的K个样本数据,准备被分类的样本的类别可以将之判断为K个样本多数所属于的类别之中。通过此种统计分析的方法可以有效地将各种大数据中的分类问题解决,通过计算将具有一定共同特征的数据摘列出来形成使用者寻找的目标客群。

3大数据分析在电网营销管理中的应用

3.1合理用电的数据分析

随着工业文明时代给世界带来的翻天覆地的变化,各种工厂、生产企业、居民生活中的耗电量都是巨大的。而考虑到未来的可持续发展道路,节能减排是人们必须时刻警惕的问题,尤其是在电力方面。因此,可以通过大数据分析技术,通过按照行业、机械设备、时间、区域等因素对海量的用电数据进行分析,找出电力的浪费现象以及可以改进的地方,精确地挖掘各种设备的反映情况,最终为电力的优化使用提供数据支撑,为未来可持续发展道路的推进奠定基础。

3.2未来行情预测

从目前社会发展情况来看,各家庭中都有很多跟电有关的电器,用电量巨大,并且会跟随不同的季节、不同区域的客户需求不同而产生明显的不同,电力企业可以运用大数据分析技术积极探索不同时间点不同区域的用电情况,并且可以通过增长情况来预测未来的变化趋势,进而为自己的电力供应方面提供数据支撑,在事情发生之前提供服务,保障居民生活的正常运行。

3.3运行保障,服务营销

由于电力企业在日常的运行之中要提供一个区域的电力供应,并且在长年累月的使用中常常会发生一些事故。电力企业可以通过历史上各区域用电情况以及运行故障发生情况来进行数据分析,进而在各区域出现类似情况的时期下,加强对该区域的电网排查工作,保障该区域的电力供应情况,并且总结出不同区域电网的承载能力,为后期持久性的服务营销打下基础。

3.4企业营销决策的分析

目前很多电力企业都已经做了自己的门户网站,便利客户的缴费等需求。电力需求客户可以通过便捷的互联网操作来进行电费的查询、缴费等工作,而电力企业可以基于门户网站,运用自己的大数据分析技术,定向地进行电力方面的营销活动,倡导自己企业的理念。并且可以成立一个专家分析系统,对于客户的各种行为进行系统化地分析,最终帮助企业在营销方面的决策更加准确,为企业的长久高效运行提供支撑,最终促进其可以健康的发展。

4结论

总而言之,经济地迅速增长给社会带来翻天覆地的变化,客户需求成为了各行各业都开始重视的问题,大数据分析技术的诞生,可以通过诸多历史行为对客户的需求产生系统化、多维度的分析,真正地用数据说话,为企业的营销决策带来数据支撑,尤其是在电力行业,客户的需求结构是现代电网运营企业不断追求的目标。因此,对于大数据在电网营销管理中的应用,对于企业来说具有重大的发展价值,值得持续地研究和探讨。

参考文献:

[1]李文靖.大数据之下的电网营销管理分析[J].信息技术,2016(01):13-14.

[2]刘凯.论信息技术在电网运用中的应用[J].技术管理,2015(20):29-30.

[3]曹梅.现代大数据分析技术的应用[J].信息管理,2015(09):45-46.

大数据时代分析篇6

通常我们所说的财务分析就是指通过一定的专业方法对会计核算的数据资料进行全面的分析,这样一来也就使得工作人员可以更加科学合理的对企业的经营、投资和分配等能力予以考察的一系列活动,财务分析可以为企业的投资和经营活动具备更加科学合理的依据,使得企业经营中的各方都能对企业有一个更加全面的了解,同时在这一过程中也可以更好的推断出企业日后的发展方向,推动企业的科学决策。会计技术是制定财务报表的重要前提,财务报表为财务分析提供了众多的基础性数据。而管理人员可以在这一过程中借助财务分析对企业运营的基本情况予以了解和掌握,从而也就更好的制定出了一个更加科学有效的管理制度。财务分析实际上是让企业的财务人员对企业的历史和当今的经营状况有一个全面客观的了解,从而也就使得企业的财务管理工作更加的科学和完善。当前是一个信息化高速发展的大数据时代,所以这也给企业的财务分析工作带来了重大的转变。大数据是从信息化开始的,它在应用的过程中也必须要依赖于计算机网络技术,在发展的过程中,数据数量越来越多,种类也越来越繁杂,数据处理的速度也有了非常明显的提升。大数据从总体上来说是存在着一些固定特征的,它变化速度快,种类多,准确性也比较高。而且随着网络技术的不断改进和完善,大数据时代的发展已经成为历史的必然,这也给传统的数据处理和分析技术带来了非常大的挑战。

大数据在物理学和其他社会学科当中都有了非常广泛的应用,但是却一直都没有受到人们的关注,直到近几年,我国的互联网和信息技术得到了长足的发展才受到了人们的关注和重视。大数据是云计算之后在IT行业当中非常重要的一次技术变革,云计算通常是可以对数据内容进行保管,在这一过程中,数据才是最为有价值的内容。任何一个文化系统当中都可以分为三个层次,一个是制度,一个是技术,一个是观念。文化系统在发展的过程中也是逐步演变的,在初期阶段是以制度为主的,随着其不断的发展又出现了以技术为主的趋势。而在当前的发展中主要是观念上的转变。当前世界已经联系成一个整体,各国的文化都可以借助互联网进行有效的融合和交流,民族之间的差异性在逐渐减弱。而在大数据时代当中,我们需要做的就是要不断的弘扬自身优秀的文化传统,保持民族文化的独立性,根据自身的发展情况和未来的变革趋势去建立属于自己的数据系统。要想更好地提升企业的财务管理能力,企业就必须进一步明确财务分析和大数据的关系,统筹兼顾,实现资源的优化配置。众所周知,财务数据是企业最基本的数据之一,其积累量较大,其分析结果直接影响着企业财务管理的最终质量。因此,企业在进行决策分析时,必须坚持客观公正原则,以财务数据为基础,制定明确的分析指标和依据,以保证企业财务管理的平稳推进和运行。在开展财务分析工作的时候,财务管理人员一方面应该对当其的管理费用细则进行详细的了解和分析,同时还要在工作中将其与前一段的数据进行详细的分析和对比,从中总结出主要的不同点,这样也就可以更加科学合理的总结费用变化的规律,同时还能从这些规律当中找到出现这种变化的根本原因,在开展原因分析的时候应该建立一个多维度的模型,在这个模型当中,要对产生变化的要素做好标记工作。在数据分析的过程中,财务人员需要将非常大的一部分精力都放在管理和核算费用的审核上,此外在这一过程中还要查找资料。但是如果要使用大数据技术的话,这些流程只要在短短的几秒钟之内就可以全部完成,这样一来也就大大的提升了工作的效率。

2、结语

随着我国社会主义市场经济体制的不断发展,大数据技术改善财务管理前景广阔。纵观目前的大数据提供商,主流商务软件厂商都在通过自主研发或收购的方式进入大数据的领域。数据属性的标签是人类经验判断的数据,是数据后的数据。所以我们在这样的情况下必须要正确的对待大数据时代的到来。

大数据时代分析篇7

云计算、物联网、社交网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数据时代正式到来[1]。对于企业来说,大数据因其数据量大、处理速度快、类型多样、蕴藏着巨大的商业价值等优势成为企业新型的战略资产和企业核心竞争力的重要基础,为企业科学合理的经营决策提供有效支撑。在当今数据日新月异的时代,企业已经不满足于随机分析和抽样分析这样的捷径,而是需要来自各个渠道种类繁多的大数据规模,这一需求的诞生使得“云会计”应运而生。在大数据时代对数据进行研究已经不是新鲜话题,也有不少学者对云会计从不同角度进行探讨,但鲜有文章对大数据下的云会计进行分析,本文将以此为主题进行论述。

一、大数据时代云会计的概念与特点

“云会计”一词最早由程平等于2011年提出,定义为构建于互联网上,并向企业提供会计核算、会计管理和会计决策服务的虚拟会计信息系统。在会计领域,云会计作为新兴的基于云计算技术和理念的会计信息化模式,可实现企业信息系统的有效集成,提高企业的管理能力和竞争优势[2]。

大数据时代的企业对云会计的侧重点是企业的管理会计和财务决策,根据这一侧重点企业将会计信息化的建设和服务外包,企业为自己享受的服务付费。因此大数据时代的云会计涉及到云服务供应商和企业用户两个方面。云服务供应商不仅为企业提供与会计相关的信息系统,如会计核算服务、管理信息系统、企业决策系统等业务服务系统,而且为企业用户提供相关的软硬件基础设施和云会计服务平台,如云会计的数据库服务、会计信息化开发应用平台、集成管理系统、服务器、网络存储等。对于企业来说,云会计是由供应商基于互联网提供的,以会计信息系统为核心的综合系统服务,且企业只需为其享受的服务付费[3]。

二、大数据时代云会计应用的体系结构

大数据时代的云会计系统的基本结构没有发生大的改变,主要是根据大数据时代数据庞杂且非结构性强等特定,增加了几个模块。主要由内部云、外部云、大数据模块和知识辅助模块构成[4],具体如下图所示:

图1 大数据时代云会计体系结构

在图1中,企业通过统一访问门户Portal访问云会计平台(内部云、外部云),利用云计算中的Paas(平台及服务)为云平台提供技术支撑。内部云平台是企业会计信息系统的核心板块,为企业提供财务业务处理和内部控制相关的信息系统[5]。大数据时代的云会计平台增加了外部云,外部云由交易所、会计师事务所、银行、工商、财政等信息系统构成,该模块的增加是为企业提供与其价值链相关的上下游企业以及相关社会部门之间的协同合作。企业的会计信息系统可通过云会计平台实现内部云与外部云的对接,更好的实现业务一体化协同。

大数据时代的云会计还增加了两个特殊的重要模块――大数据模块和知识辅助模块。企业内部云产生的财务数据以及外部云产生的与价值链相关的数据存储到企业的大数据库中,由于存在数据来源复杂,数据结构各异且数据格式不一致等特点,必须通过大数据处理技术对数据进行抽取、存储、处理、分析,最后提炼为知识,形成企业的生产力,这些过程有企业大数据模块和知识辅助模块完成。

三、大数据时代下的云模型

大数据时代的云会计信息数量巨大且来源庞杂,非结构性强,含有很多不确定性和模糊性。为了将海量数据中的有用成分形成知识,将云会计中大量不确定性核算中定性分析转化为定量分析,本文引进云模型。

云模型最早由李德毅院士提出,云由云滴组成,云滴在论域上的分布称为云模型。本文研究云模型中的一种形式――正态云模型。定义正态云需要通过云的三个数字特征:期望Ex,熵En和超熵He。期望值Ex是云滴在论域空间分布的期望,是云中心对应的x的值;熵En代表定性概念的可度量粒度,是对不确定性的度量;超熵He 是熵的熵,是对熵的不确定性度量。

正态云的生成算法既可以用软件的方式实现,又可以固化成硬件实现,称为云发生器(Cloud Generator)。本文通过一维正态云发生器生成云模型。

正向云发生器(Forward Cloud Generator)是从定性概念到其定量表示的映射,它根据云的数字特征(Ex,En,He)产生云滴,每个云滴都是该定性概念的一次具体数字实现。对于定性概念A,产生一个期望值为Ex,方差为En的随机数Xi,即Xi~N(Ex,En’2),产生一个均值为En,方差为He的正态随机数En’,即En’~(En,He’2)。

计算数据的样本均值,由均值得到期望Ex=1n∑ni=1Xi

计算一阶样本绝对中心矩,得出样本方差和熵En=π2×1n∑ni=1|Xi-X―|

根据正态函数的性质,有yi=Ic(x)= e-(x-Ex)22En′2

令(xi,yi)为一个云滴,它是该云表示的语言值在数量上的一次具体实现,其中xi为定性概念在论域中这一次对应的数值,yi为属于这个语言值的程度的量度;对论域中大量的定性概念进行定量度量,直到产生满足要求数目的云滴数,形成云模型:f(x)=∞-∞12πHe|y|exp[-(x-Ex)22y2-(y-En)22He2]dy

四、结语

大数据时代分析篇8

关键词:大数据时代 决策分析体系

市场变化越来越快,竞争越来越激烈,客户的需求越来越个性化,这是当今市场特别是消费品市场的重要特征。要获得竞争优势,就要求企业比竞争对手要更快速响应、更深刻洞察市场变化、产业运行、技术更替,因此决策周期必须比竞争对手更短,决策信息比竞争对手更充分。这就为传统的决策分析体系提出了更高的要求。

随着大数据时代的到来,企业对各类数据的获取拥有了更广泛和便利的渠道,这些数据为企业决策质量的提升起到了重要作用。这些数据包括:

互联网实时产生了大量的电商消费品交易数据、交互数据,竞争对手的价格与市场表现,以及消费者的评价与偏好等;

上市公司定期着企业财务数据、证券与投行公司定期行业情报与数据等;

政府网站不断公开各类统计数据,包括行业运行数据、海关进出口、宏观经济运行、专利申报、企业信用等;

财经媒体不断调研商业情报,各类行业动态数据等;

各类专业期刊、行业期刊、电子数据库都随时产生着有价值的决策信息和情报等;

……

古人云“行贵速焉,慢则人先”,如何利用这些数据提炼出有价值的外部情报,从而准确决策、快速应、抢占先机,如何深刻洞察产业、客户、技术与竞争对手,是大多数企业提升竞争力的新课题。

传统的决策分析体系的管理场景

中国大多数企业都建立了自己的经营分析体系,大多数企业特别是中小型企业,他们的经营决策分析大概是这样的场景:

1.规律性的统计:企业从上到下有完善的报表与指标体系,以月为单位进行采集,以季度、年度为周期来统计分析企业的运行情况。

2. 依靠内部搜集数据:其数据来源主要依靠企业内部各部门,包括财务、生产、销售、库存、采购等部门,数据采集主要依靠ERP、CRM等信息系统,或者员工日常的手工填报,这些数据都来自企业内部,对竞争对手、消费者等情报搜集,主要也依靠内部员工。

3. 进行常规的决策分析:关注的内容主要是市场、渠道、成本、交付、质量、人事的运行表现,通过数据的历史对比,发现企业运行的问题与变化,做出应对与改善决策,同时这些分析结果,也是内部KPI指标的重要来源。

传统决策分析体系面临的挑战

这样的决策分析体系逐步被大多数企业采纳,就像一个企业健康监控体系,在企业内部构建起一个神经网络,及时对企业运行的情况把脉。对于外部环境变化快速、竞争激烈的企业,随着竞争压力不断导入,逼迫他们不仅需要构建对内的神经网络,也需要对外部的千里眼、顺风耳,及时感知外部环境的变化。因此,对于这类企业,传统的决策分析体系正面临着以下几个的挑战:

1. 传统决策分析体系内部为信息系统,而非情报系统,决策信息不足,容易造成:

(1)对外部的未知逐步扩大:在大数据时代下,随着移动互联网发展,外部数据越来越丰富、越来越易获知,他人知道的越来越多,则你的未知领域就相对在扩大。

(2)判断结果可能截然相反,内部判断受到局限:美国著名云计算商用软件厂商NetSuite的年报披露,近三年增长率分别为9%、16%、22%,营销费用每年占整个成本结构的40%、42%、45%,2012年的营收为2.6亿美金。仅从其内部数据来看,NetSuite在微弱成本调整下保持了加速增长,是不错的成绩。若我们再加入一家美国的云计算商用软件厂商Workday的数据,近三年的增长率分别为264%、170%、98%,营销费用每年仅占整个成本结构的29%、27%、29%,2011年营收1.3亿美金。加入一个新的情报,就立刻得到了相反的结论:NetSuite在投入了较高营销成本的情况下,得到了较慢的增长。

2. 传统决策分析体系只为了掌握情况,而非预知变化占先机,不利于规避风险获得资源,中小企业在这一块更为薄弱,其影响在于:

(1)对宏观环境的反应迟缓:若2011年底就能获取阿里巴巴等电商平台的询盘量,就能提前预知2012年制造业困难的信息,制造型企业就能第一时间做好应对策略:减少采购、停止招工、培育国内市场、修炼内功。投资型企业若在第一时间了解到统计局的2012年2-4月发电量同比增长率为20%、7.2%,0.7%,就会更真实地确定2012年经济严重减缓的事实,预判经济不景气时将会繁荣的产业,例如:影视娱乐、教育培训、信托与小额贷款等产业,找到投资机会;同时也能预判将会比较困难的产业,找到并购机会。而目前的企业家主要根据自己的渠道了解宏观经济情况,没有将外部的宏观经济情报纳入决策分析体系。

(2)对产业机会反应迟钝:目前企业家主要根据自身的知识掌握产业动态,没有将前沿的、跨界产业信息纳入日常的决策分析。例如2011年智能移动终端的出货量超过PC,这个信息对传统产业的影响是巨大的,移动互联网必将成为企业重要的客户接触界面、服务界面、沟通界面、销售界面,谁提前一天进入,就能提前一天获得用户、培育用户、提升用户粘度,获得品牌声誉与生意机会。例如一家奢侈品厂商将奔驰、宝马、奥迪等名车品牌的4S布点路线作为自己的开店地图,每月更新,奔驰宝马去的地方,就是自己的购买者聚集的地方。

(3)对政策机会把握不足:从中央各部委,到地方各种支持政策,在政府主导下的产业基金、地区开发、援外、补贴、退税,以及某些产业税收、土地、配套资金、办公楼宇、劳动人事,都蕴含着许多产业机会。例如十一五规划中深圳将电子装备纳入重点发展产业,每年推出若干重点项目让企业承担研制任务,并对其销售进行补贴。又如成都高新区2013年对移动互联网企业提供以下扶持政策:一免(免5年办公房租),二补(对川外公司管理层和技术人员给予补贴),三奖励(100万创业资金、200万企业经营者奖、市场活动经费补贴50%)。若缺乏对外部政策机会的敏锐获取,则易错失资源让与他人。目前很多企业对这类情报主要依靠企业家个人网络获取,但这种方式存在一定的偶然性、局限性。

3.传统决策分析体系是管理手段,而非竞争手段,不利于跟踪技术与市场前沿的变化,持续创新,正面临着一个重大挑战:缺乏大规模数据支撑大量创新:海尔集团张瑞敏预判到,进入互联网时代,企业和用户之间信息不对称的主动权发生扭转,过去企业生产什么用户接受什么。但现在用户可以在互联网上选择、比较所有产品、价格,主动权发生了转移,从以企业为中心变为以用户为中心,这是非常大的改变,企业必须从大规模制造改变为大规模定制,从一个型号生产几十万上百万,到几十万个型号的生产几十万上百万。大量的创新意味着企业要掌握比竞争对手多几倍的数据量和信息量,需要比竞争对手理解掌握行业的技术现状、专利现状,掌握更多客户的需求、偏好、习惯,而且需要更快速、更高频率的创新,满足客户的需求。传统的决策分析体系,对市场与消费者信息的搜集与研究严重不足,很难支撑企业大规模的创新。

利用大数据情报体系构筑企业竞争力

无论是传统服装产业,还是高科技企业,都已经涌现出众多的企业,通过多市场与技术情报的快速、及时、大量掌握,快速制定大量的产品开发决策,抢占先机,构筑核心竞争力。

1.服装企业的最佳实践。

(1)传统服装业的经营决策场景——今年决定明年。

当秋冬季来到时,传统服装企业经营者根据今年的经营情况与流行趋势进行分析,预测明年秋冬季可能流行的款式和销量,然后让设计师设计款式,春季则召开秋冬季订货会,夏季初则开始大批量生产,夏季末向渠道仓库压货,整个周期在半年以上。这种经营分析模式主要基于历史的数据对未来进行分析,其优点是可以大规模、大批量生产降低成本,有充分时间进行制造和营销,缺点是响应速度慢、款式不多,不能捕捉时尚趋势未来发生的变化,一旦决策失误,或者期间发生不可预知的波动,将造成大量的库存积压。

(2)西班牙Zara的产品设计决策——基于大量时尚情报的设计+快速生产+小库存模式。

西班牙Zara是国际著名的大众快速时尚品牌。为了实现其大量快速的产品开发,Zara会定期派人在世界各地专门记录年轻时尚领袖们的穿着打扮,从行业协会、时尚会等各种渠道收集时尚的信息。其总部有一个200人的设计团队,从收集的各种信息中取得灵感设计服装。Zara的设计师、市场专家、采购专家联合组成了一个“商务团队”,他们密切合作缩短设计的酝酿期。整个团队都在一个地方办公,即Inditex总部,因此讨论、审核、批准也是同样迅速。一旦设计款式获得通过,生产指令就可以马上下达到工厂,从设计到生产最快2天,整个前导时间最短为12天,仅2004年,Zara就一共设计了1.2万款产品。这种基于大量情报的产品开发模式,构成了Zara的核心竞争力——快速时尚。

(3)韩都衣舍的款式设计决策——基于大量流行款式情报的快速设计+快速上架模式。

国内一家最近几年做女性服装的淘宝网商——韩都衣舍近几年迅速崛起,2008年营业额才130万,员工17名,发展到2011年营业额达到3亿元1000名员工,在激烈的电子网商中迅速崛起,韩都衣舍定位专做韩国女装的同时,确定了自己的致胜法宝——比竞争对手款式多,更新更快。

为了实现这种能力,从韩国代购开始,逐步建立买手小组,由懂时尚的买手组成,每月定期到韩国大量买进最热门的流行款式,根据得到的款式大量创新,接着买手小组不断复制扩张,每月输入的款式量越多。这种通过实时大量的时尚情报的输入,形成了韩都衣舍的核心能力。

3. 科技企业的最佳实践。

(1)海尔的产品研发决策——基于大量行业技术专利与市场情报的研究。

《中欧商业评论》曾详细披露过海尔的竞争情报体系,海尔的竞争情报工作始于八十年代,1988年便建立了简便易查、全面实用的检索专利卡片系统,搜集了1974年至1986年世界25个主要工业国家有关冰箱的1.4万条专利文献题录。1990年订购了三种中国专利公报和制冷领域的专利说明书,1995年建立了中国家电行业专利信息库,定期提供最新的专利信息,跟踪研究发达国家和国内同行的技术水平、发展状况和市场需求,紧紧抓住了进入欧美市场的切入点、时机、销售方式和海外销售商。海尔对已有产品项目进行国内外技术动态信息监控,从相关专利和技术领域对国内外目标公司从不同角度进行专利跟踪,形成强大的综合专利情报资料库,随查随用。

海尔的专利情报报告在产品创新决策中起着决定性作用,在对某个技术领域有一个基本认识后,科研人员利用专利情报分析进一步评估技术热点和前景,寻找某些领域内的技术空隙,并在研发项目的实施中进行技术创新和回避设计,通过专利组合分析方法辅助确定研发方向。专利组合分析方法有助于企业确立专利技术所处技术生命周期的具体阶段,以及是否有继续大规模投入开发的价值。

海尔情报系统的一大特点是技术情报与市场情报并重。因此专利技术的发展方向与市场结合成为海尔创新的核心动力。正是基于大量对专利和市场情报的分析,海尔开发出了适合美国大学宿舍使用的冰箱、可以清洗农作物根茎的洗衣机、韩式双动力洗衣机、酒柜、便携式洗衣机和可当工作台的洗碗机等产品。

(2)华为的产品技术突破——基于大量行业专利情报搜集的研发模式。

华为的情报工作以搜集国际竞争对手和领先企业的最佳实践以及国际领先的管理方法和专利技术为主。早年资金短缺时,华为采纳“压强原则”,对核心技术和专利研发进行重点投入,目的是在局部核心技术领域有重点突破。在专利技术情报搜集、分析和专利保护上,形成了一整套的方法论和情报体系。具体包括:

情报搜集与研发定位,华为运用定量、定性分析方法,结合国际竞争需要和企业需求及能力,将专利文献中的技术内容、人(专利申请人、发明人)、时间(专利申请时间、专利公告日)和地点(受理局、指定国、同族专利项)进行系统的调查和统计分析,为制定企业研发重点和战略提供决策支持;

情报整合和价值判断,根据专利申请量盘点技术发展史、技术发展趋势和目前所处阶段以及成熟度,以判断研发该技术的价值含量;

情报分析和决策支持,华为根据对全球专利的系统搜集和分析,预测未来新技术的发展方向和市场趋势,为公司发展策略的制定提供参考。同时,对可能与竞争对手产生竞争关系的专利进行识别和确定,并提出具有针对性的规避、无效、撤销等策略,以避免侵犯他人专利权。

2008年,华为在海外申请的专利数量为世界第一,获得全球公司创新奖,也是因为先进的无线射频拉远技术(Remote Radio Head)改变了世界认为中国企业只能模仿、不会创造的传统印象。

如何构建企业情报的来源

并不是所有企业都要对外部情报大量掌握,对于那些市场竞争激烈、对外部环境依赖较大、机会稍纵即逝、需要通过快速响应和大量创新构建竞争力的企业,需要大量掌握外部的情报来构筑自己的经营决策体系。

众多企业对外部情报的搜集,主要依靠企业家个人或高管团队,由于企业家接触层面高、接触面广,能得到很多大家不能得到的核心情报。在大数据时代下,信息传播越来越快,情报越来越容易得到。我们不能高估企业家人际网络对情报的贡献,也不能低估大数据时代公开信息蕴藏的情报价值,以及员工头脑中的情报线索。企业可以尝试用以下方式确定情报来源:

1.通过互联网专业渠道获取。

大数据时代企业能够通过付费或免费方式,得到包括竞争情报、宏观经济、政策机会、标杆前沿的数据:

竞争情报:可通过电子商务网站获得竞争对手的产品、价格和营销策略,通过新闻活动、公开的企业专利库、企业信息库及时掌握竞争对手的情况;

客户数据:可通过电商网站、自身门户获得消费者从互联网或移动终端直接反馈的评价和建议;

政策机会:可通过国务院公报、各地方政府公布的产业政策、地方的规划细则、各地方产业园信息寻找机会线索,通过线索直接接洽获取更详实的情报。

外部环境:可通过国内外每月例行公布的经济数据、金融指数、产业运行的数据、海关数据等来预判未来的变化。

标杆企业:可通过招股书、年报、国外证券市场寻找国际标杆企业做法。

整体来说,中国企业对外部信息的和掌握程度很不充分,试错成本较高,一般都是边干边了解,随着政府数据公开度的改善,相信国内的数据公开亦会在改善。

2. 通过员工网络获取。

对于企业家已知的已知,公司每月通过报表体系进行分析汇总,得到更加量化的确认;对于企业家已知的未知,企业家过问也是能知道的;但是,对于未知的未知,企业家就没办法及时掌握了,除非触发了问题。

某信托公司一线员工,在和朋友聊天的过程中,得知一家担保公司B正在找反担保,细细追究担保原因,打听到是零售巨头M集团总部准备融资,正寻找担保机构。该员工没有能力接触到M集团,但他第一时间将这个项目情报反馈给了公司副总,该老总立刻动用自己的人脉资源,通过一银行行长约到了M集团的财务总监,面谈信托融资事宜。

企业内人人都是情报员,员工处于战斗的一线,能及时获取客户和竞争对手内部的人事变化、经营活动,比总部更了解当地的政策机会、市场特点。大量的信息都在各员工脑中,都是孤岛性质,没有公司层面的集成,很多情报已经被掌握,但是很难上升到部门层面,不利于企业更充分的决策。

企业可建立专门的激励机制和团队,集成公司内部情报信息,解决情报来源,激励机制的关键不光是奖金奖励,重点在于这些情报有合适的去处,才能产生价值形成激励,例如:

对新增销售线索的激励,集成市场情报,主要供销售部门使用;

购买各地竞争对手乃至国外同行产品进行体验和拆解,或搜集同行的专利申报情况,集成产品情报,主要供研发部门和市场部使用;

通过对各地市场和消费者的调研分析,集成市场情报,供市场、销售、研发部使用;

通过专业的职能岗位,跟踪科技前沿、同行专利创新、行业政策动态,供研发和企业家使用;

3. 通过对大量数据的分析挖掘获得情报。

企业通过自身的信息系统、门户网站、客服系统、电商平台积累了大量的历史数据,而目前企业亦可通过付费,购买电商的历史数据库。

2012年1月份:瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,会上的报告《大数据,大影响》(Big Data, Big Impact)宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。大数据时代的带来,为企业通过应用数据提升企业竞争力提供了营养和工具。通过应用大数据,企业传统的决策体系将得到根本的改变。

《大数据》(作者:维克托·迈尔·舍恩伯格)一书中披露海员莫里对搜集的数百年来的海航日志、地图等数据,并结合洋流、风向等总共120万个数据点进行分析,写出《海洋的地理物理学》,帮助航海家找到了更有效的航海线路。日本的科学家通过在汽车座椅上加装360个传感器,通过压力数据的搜集来判断驾驶者的姿态并识别驾驶者的身份,从而保障驾驶的安全。在美国出现了众多通过历史价格数据,来预测未来价格的变化的网站。

数据本身不能反映出某些规律和信息,通过对大量数据的分析和挖掘,就可以发现意想不到的联系。

上一篇:农药污染的防治措施范文 下一篇:移动支付总结范文