大数据技术论文范文

时间:2023-03-18 15:20:33

大数据技术论文

大数据技术论文范文第1篇

关键词:大数据;学术期刊;评价标准;创新

DOI:10.163 15/j.stm.2016.04.014

中图分类号:F276.3 文献标志码:A

学术期刊办刊水平的高低最终要通过期刊评价予以检验,从一定程度上讲,期刊评价的标准决定了期刊未来发展的方向和目标,期刊评价标准的合理设立对学术期刊的健康成长至关重要。随着移动互联网、云计算、可信计算等一系列新型信息技术的迅猛发展,一个大规模数据生产、储存、分享、应用的“大数据”时代逐渐开启。“大数据”时代的到来,对我国学术期刊的未来发展将产生巨大影响,期刊的运营模式、出版流程都将发生根本性变革,如一些学者所预测的,“大数据”时代的到来将造就全新意义上的学术期刊。相应地,“大数据”也将导致学术期刊评价的革命,一方面,大数据时代学术期刊功能定位的变化要求必须确立新的、符合时展要求的评价标准,另一方面,大数据科技的应用也将为期刊评价提供新的技术手段与方法,大大提升期刊评价标准的精确性与全面性。在这一背景下,深刻把握大数据时代学术期刊发展规律,科学探析大数据时代期刊评价标准可能的创新与发展方向,对于我们有效应对大数据挑战,推动学术期刊的未来发展具有重大意义。本文拟对这一问题进行初步探讨,以期对未来期刊评价方面的研究有所启示。

1我国当前主要学术期刊评价系统及其评价标准

1.1我国当前主要学术评价系统

我国当前的学术评价体系起源于20世纪70年代,经过几十年的变革与发展,目前形成了既符合国际化评价标准要求又具有我国学术研究特色的学术期刊评价体系。根据学科和专业研究领域的不同,目前已形成了5大期刊评价权威系统并根据其系统要求定期出台期刊评价报告,这5大系统包括:南京大学研制的《中国人文社会科学引文索引》、北京大学图书馆研制的《中文核心期刊要目总览》、中国社科院文献信息中心研制的《中国人文科学引文数据库》、中国科学院文献情报中心研制的《中国科学引文数据库(CSCD)》以及中国科学技术研究所研制的《中国科技论文与引文数据库》。

1.2五大评价系统的具体评价标准及其特征

这5大评价系统的期刊评价标准主要是根据布拉德福文献集中定律和加菲尔德文献集中定律予以制定,其具体评价指标则参考了美国EI、SCI等国际期刊数据库的评价标准。所谓布拉德福集中定律,是1934年由英国学者S.L.布拉德福提出的,他在对一些特定的学科领域期刊的数量及其刊登的相关论文数量进行统计的时候,发现期刊的内容对于某一个别学科来说呈现出远近亲疏不等的情况,“如果将科学期刊按其登载某个学科论文数量的大小,以渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成1:a:a的关系。”核心区的期刊就是刊载学科论文数量最多、包含相关信息最丰富的那部分期刊。加菲尔德文献集中定律,是20世界60年代,由美国学者加菲尔德提出的期刊分布定律,他通过对一些综合性和专业性检索工具检索和收录论文的比率进行分析,发现各学科的核心期刊主要集中在少数的期刊中,而主要的期刊则更少,大多数学科期刊的发展呈现出明显的集聚效应。这两大定律是目前国际上制定学术期刊评价标准的主要依据,我国五大期刊评价系统也主要以这2个定律为准则,并在此基础上制定了大致类似的评价标准,五大评价系统的具体评价指标,如表1所示。

这五大评价系统的评价标准具有几个共同的特征:首先,5个期刊评价系统都是采用引文分析法,即通过对期刊论文索引量、被引频次和影响因子等指标的统计分析来对期刊质量作出评价,这3个指标也是期刊评价中的核心标准;其次,期刊评价数据的采集主要依托中国知网、万方、维普等网络数据库的数据资源进行统计,不进人这些数据库的文献不计入统计;再次,期刊评价基本是围绕期刊刊载文章的影响力指标进行评价,在专业领域越有影响的期刊,其评价结果就越好。

客观来讲,当前五大评价系统的评价标准是在借鉴国际已有成功经验并结合了我国学术研究特色来设定和构建的,它通过对客观数据的严格统计分析来对期刊予以评价,在一定程度上避免了人情因素、主观偏见对期刊评价的负面影响,具有相当的客观性与科学性。但同时,以影响因子和引文分析为核心的评价标准也存在诸多局限:首先,由于不同检索数据库所收录和统计的文献及期刊种类和数量有所不同,导致同一期刊依据不同数据库数据计算出的影响因子常常产生巨大差异;其次,不同学科发展情况和设置缺陷导致期刊统计源结构不合理,一些学科的期刊统计源期刊很多,影响因子较高,而一些冷门学科的期刊统计源极少,影响因子很低;最后,当前的评价标准主要关注后的索引量、被引频次,不仅评价指标片面,而且难以避免不当引文、无效引文对统计结果的影响。

2大数据对学术期刊评价标准的影响

大数据技术的应用给学术期刊的未来发展带来巨大变革,这些变革集中体现在对学术期刊评价标准的深刻影响之中。

2.1期刊评价的可采集指标更为丰富

在大数据的背景下,期刊出版发行形态将发生巨大变化,以前以纸质印刷、定期刊发为标志的出版方式将向电子化、网络化、不定期出版方向转移。期刊论文的创作、审核、修改、编辑、发表以及发表后所产生的社会反馈和影响都将依托于数字化网络平台进行,而这整个过程中的所有数据也将通过大数据技术予以记录,除了转引率、被引频次等数据,大数据和云存储技术可以为期刊评价提供更丰富的数据资源和种类以备采集,并作为期刊评价新的指标。比如,大数据技术支持下的电子阅读终端可以记录读者对某篇文章的阅读时间、次数,甚至在某些段落的停留时间,这对于未来期刊的反馈评价将是一个重要指标;再比如,通过“云存储”、“云计算”等技术可以对前的选题热度、潜在价值做出客观评测和计算,这可以做为期刊选题价值的评价指标;除此之外,大数据还可以收集并记录期刊选题策划方案、编辑规范性、构图设计水平等方面的信息,为学术期刊的整体评价提供参照指标。

2.2期刊评价的数据统计更加全面精准

以往对评价数据的采集,主要依据知网、维普、万方等数据库统计源,但许多没有被这些数据库收录的期刊却不能进入统计范围,而且由于检索系统所收录的期刊群组成差异较大,所计算的影响因子值也会产生较大差异,导致同一刊物在不同检索系统中计算出明显不同的影响因子数。而依托大数据技术的期刊评价数据采集,不仅可以覆盖全网络信息资源并统一计算方法,避免因数据库收录不足和算法差异导致的因子计算缺陷,而且对于被何种方式引用,引用量多少,有效还是无效引用,自引还是他引,都能准确记录,实现对期刊评价相关数据更为全面和精准的统计。更关键的是,大数据能够为期刊评价提供论文编辑出版发行过程中的全数据样本,并对后的索引转载情况实时动态更新,对读者阅读评价反馈全面搜集,从而实现评价数据统计的静态与动态统一、主观与客观结合。

2.3期刊评价的读者影响力更加突出

大数据背景下,期刊评价将更加突出读者评价的地位和作用。以前的期刊评价统计实际上是注重论文引用者和转载者的评价地位,兼顾同行、专家和评价机构的综合评议。但是对公开发行的期刊论文来说,论文的引用和转载者可能只是读者中的一小部分,大多数读者在阅读后不一定会将之运用到学术创作之中,但同样会对文章质量作出心理评价,这种评价实际比单纯的引文评价更全面、更有说服力但也更难以计量。而随着数字技术的发展,大数据时代的期刊出版将逐渐进化到电子出版阶段,新的电子期刊平台将不仅是一个阅读平台,更是期刊社为读者、作者、专家提供的一个互动服务平台,在这个平台上,不仅读者的浏览偏好和阅读反馈会被储存下来,而且通过独特的互动窗口,他们还可以和作者、编辑、审稿专家进行直接讨论,他们对文章内容的意见、对刊物选题策划、栏目设计、编辑方式、服务水平甚至是办刊宗旨的建议都将被完整记录,并成为期刊评价重要的参考指标。与此同时,由于大数据技术将使评价机构进行期刊数据收集和质量评价的整个过程变得更为公开透明,无形中就降低了评价机构的控制力与影响力,相对地也就更加凸显出读者群体在期刊评价中的作用。

2.4期刊评价的创新性指标更加重要

大数据时代的期刊将进入电子出版为主,纸质出版为辅的阶段。相对于纸质载体,电子载体具有无限承载能力和丰富多样的表现形式,这必然突破原来期刊篇幅、版面、格式的限制,期刊刊载论文数量将大大增加。同时,由于期刊审稿流程的变革,期刊未来会将收到的论文经过简单编辑处理直接通过电子平台,而不再经过繁琐的审稿流程(经过读者和同行评议,获得较高评价的论文再以纸质出版),这又必然导致期刊论文质量的良莠不齐。原来以索引量和发表数的比值为计算指标的影响因子评价的缺陷将更加突出。如何从海量出版信息中发现、挖掘出具有创新价值的内容,以最方便的方式提供给读者阅读评价,将是期刊首先要考虑的问题,也是未来期刊评价中非常重要的参考指标,这也将使期刊评价中的创新性、吸引力指标凸显到更加重要的位置。

3大数据背景下学术期刊评价标准的具体指标及其计算公式

大数据彻底改变了学术期刊未来发展模式及其评价方式,同时也为未来期刊评价的发展创新提供了强大的技术支持和充足的数据资源。笔者认为,依托大数据技术,未来学术期刊评价的参照指标将发生巨大变化,与当前主要参照转引率和影响因子来评价不同,未来期刊评价的指标将更加多元、更加精细,而且也将在很大程度上弥补当前评价指标的局限与不足。具体来说,未来大数据背景下,学术期刊的评价指标将可能包括以下几个方面:

3.1关注度评价指标

依靠大数据的技术支持,未来期刊评价可以尝试将期刊论文的关注度列入评价标准之中。电子化阅读终端和云计算技术可以准确记录读者在阅读期刊时的阅读量、点击量、阅读时间、阅读段落甚至是可能的阅读字数,有效记录并计算读者阅读的关注点与精细程度,阅读之后在学术社交网络和开放存取平台中被讨论的次数,并实现对期刊论文受关注度地量化统计,这将为期刊评价提供重要的参考指标。客观来讲,期刊的受关注度并不能直接反映期刊刊载文章的水平和深度,尤其对一些相对冷门的学科和研究领域,文章的专业性比较强,读者比较小众,关注度也较低。因此,在将关注度作为期刊评价指标时,必须避免单纯的量化统计,而应结合学科在不同时期的纵向对比,以及文章在稳定读者群体中关注度的变化来具体衡量,笔者认为,可以尝试在不同学科之间设置合理的浮动系数,以统计数据乘以浮动系数来计算期刊真实的关注度水平。

3.2创新观点评价指标

在大数据时代,对期刊学术水平的评价将不只体现在对其刊载论文水平的评价上,而会更应进一步细化到观点评价的层面。未来结合大数据技术的检索工具可以实现对期刊发表内容的观点检索,对期刊中关注度高、创新性大、前沿性强、具有较大影响力的观点进行数据统计和分析,以读者和同行“点亮”和转发的观点数量为统计指标,代替单纯对论文引用和下载地统计。观点评价的特点在于灵活、简洁,易于突出重点,可以更加凸显作者思维成果的创新度。它改变了以往期刊评价难以量化计算期刊创新性的局限,细化了期刊评价的创新性标准。与论文评价相比,它不仅更加适应数字化出版时代“眼球经济”发展潮流,同时也更加符合大数据时代期刊出版业态的变革趋势。

3.3读者反馈评价指标

大数据技术论文范文第2篇

关键词 大数据 CNKI 可视化 研究现状

中图分类号:G353.1 文献标识码:A

0引言

目前对大数据研究现状综述的中文文献较少,本文以2007-2015年中国知网CNKI收录的有关大数据研究的相关文献为对象,通过Ucinet[1]、SPSS等数据处理工具进行了可视化分析,为相关研究和应用提供参考。

1数据来源与研究方法

本文在CNKI检索区域主题字段、题名段、关键词段中分别输入“大数据”,时间字段起始为2007年1月1日,截止时间为2015年8月1日,主题字段和题名、关键词间采用“与”运算,题名和关键词间采用“或”运算,检索完后经简单处理共获得到4707篇有效文献,对相关字段进行统计整理。

2大数据研究文献的时间分布

衡量某领域发展的重要指标为学术论文数量的变化,它在一定程度上反映了该领域研究的基本水平和发展规律,绘制相应的分布曲线,为评价该领域所处的阶段具有重要意义,从大数据研究的中文文献分布(如图1所示)情况看,从2013年随着舍恩伯格的《大数据时代》一书的热销,研究热度呈现高速上升,2014年较2013增长了2.5倍,2015年截止到8月1日已经有1808篇文献发表,按照目前的趋势预计到年底将超过3000篇。随着我国对“互联网+”关注的升温,大数据相关研究论文数量也会呈现稳定发展的趋势。

3大数据研究文献的空间分布

3.1机构单位分布

在检索到的4707篇文献共涉及526个,数量在14篇及以上的机构单位有40个,在25篇及其以上的机构共有14个,如表1所示,由高产发文机构可以看出在大数据研究介入方面我国985高校走在前列,是大数据技术研究的前沿基地,中国人民大学以68篇排名第一,该校在2009年3月,便成立中国调查与数据中心,全面支持国家智库战略性研究,同时在2014年牵头联合北京大学、中国科学院大学、中央财经大学、首都经济贸易大学设立大数据分析硕士培养协同创新平台,率先迈出了坚实的一步。

3.2论文基金资助情况

在检索到的4707篇文献中,获得基金资助的文献共有737篇,如图2所示,其中部级层面的基金资助为604篇,国家自然科学基金和国家社会科学基金两大基金分别资助280篇和132篇,“863计划”和“973计划”也分别资助49篇和37篇,可见近几年国家对大数据研究的重视程度,已将大数据研究定位为国家战略。在省级层面资助中,如图3所示,江苏省以28篇占据第一位,走在大数据研究的前沿,河北省、陕西省、广东省、山东省、重庆市分列第二至六位,可见各省市已经普遍开始接受将拥有的数据规模以及从数据中获取知识和价值的能力作为竞争力评价的重要指标。

3.3论文研究类别情况

截止到2015年8月1日,大数据研究中硕士论文有122篇,博士论文有5篇,这与大数据研究从近三年开始刚关注有一定的关系,硕博论文的产生需要一定的时间跨度,但这127篇硕博论文已经表明越来越多的高校和研究机构已经开始关注这个领域,其中5篇博士论文分别来自于吉林大学(2篇)、中共中央党校、武汉大学和上海大学,下载次数最多的博士论文(《大数据时代基于物联网和云计算的地质信息化研究》)已经达到14000次以上,被引用18次。而122篇硕士论文的分布如图4所示,北京邮电大学(10篇)和吉林大学(9篇)分居前两位,在发文总量上(见表1)北京邮电大学(28篇)、吉林大学(26)篇也分别位居第9位和第11位,并且吉林大学还有2篇博士论文,可见两所高校在大数据研究方面的地位,北京邮电大学设有数据科学中心并已在网络流量分析、互联网用户行为分析、无线网络优化等多个领域积累了丰富经验和成果。吉林大学经济学院和金融学院也为本科生开设了《数据科学与大数据分析》课程,培养学生的计算思维、数据思维和互联网思维,更好地迎接“互联网+”时代的到来。

3.4大数据研究的热点

关键词是论文的高度概括和凝练,频次高的关键词常被用来确定一个研究领域的热点问题,通过对检索到的4707篇文献进行整理,共有6835个关键词,对提取的关键词(选取Top44(频次大于等于10))利用可视化软件Ucinet、NetDraw绘制共现网络知识图谱进行可视化分析,如图5所示。由共线图谱可知,“大数据”、“数据挖掘”、“云计算”、“机器学习”、“Hadoop”之间的联系最为密切,而其他节点也均有此热点关键词有联系。

4结语

本文以2007-2015年CNKI收录的4707篇以大数据为主题的研究文献为样本,从文献计量学的视角,利用SPSS、Ucinet、NetDraw等可视化软件以知识图谱的方式对大数据研究的中文文献进行了分析,相信在不远的将来会有更多大数据研究的理论成果应用于国民生产,推动国家新一轮的经济增长。

参考文献

[1] 包惠民,李智.CNKI数据实现ucinet共现分析的方法及实证分析[J].软件

导刊・教育技术,2012(1):91-93.

[2] 滕瀚,曾天山.改革开放后我国教育学科的社会关注度分析――以《新华文

摘》教育学论文转载为例[J].高等教育研究,2013(9):36-45.

[3] 马费成,张勤.国内外知识管理研究热点-基于词频的统计分析[J].情报学

大数据技术论文范文第3篇

科技期刊 信息传播价值链 大数据

王青,中国医学科学院医学信息研究所,编审;董秀,中国医学科学院肿瘤医院《中华放射肿瘤学杂志》编辑部主任。

随着博客、社交网络等新型信息方式的不断涌现以及云计算、物联网等技术的兴起,数据正以前所未有的速度不断地增长和累积,大数据时代已经来临。一般意义上,大数据是指无法在可容忍的时间内用传统信息技术和软硬件工具进行感知、获取、管理、处理和服务的数据集合,[1]其特点可以总结为4V,即体量浩大(Volume )、模态繁多(Variety)、生成快速(Velocity )和价值大密度低(Value )。大数据引起了各国产业界、科技界和政府部门的高度关注,将对未来的科技与经济发展带来深远影响。

科技期刊的出版是对科技信息的有效传播, 具有连续性、时效性、创新性、渗透性等特点,其出版过程同时也是价值创造、价值增值与价值实现的过程。大数据技术对科技期刊信息传播价值链产生一定影响,可以优化科技期刊信息传播的价值活动, 即实现信息智能采集与分析、变革出版流程、重建信息传播平台、提供个性化服务等, 进而使科技期刊通过价值增值与价值实现获得竞争优势。

一、科技期刊信息价值链的构成

1. 价值链的概念

迈克尔・波特的价值链理论认为:企业为创造价值而开展各项生产经营活动 , 这些活动按照内在的关系连接在一起 , 彼此相互支持,以确保企业经营目标的实现。 [2]科技期刊从信息采集、编辑加工到出版发行等,这一系列相互联系的信息管理与信息服务活动存在于由作者、出版机构、读者所构成的动态的价值链系统中,因此可以将科技期刊出版的整个业务流程看做是一个不断增值的信息传播价值链。

2. 科技期刊信息传播价值链的构成

(1)供应链:作者。供应链是科技期刊信息传播价值链的起点,科技期刊的信息价值在此部分获取,提供信息价值源泉的是广大作者。供应链的管理目标是尽可能地获得有价值的信息,增加信息价值的有效供给。[3]对科技期刊来说能实现科技期刊办刊目标的信息就是有价值的信息,它不但要适合科技期刊的定位,突出刊物特色,而且还要尽量多元化,满足读者的多样需求。因此,科技期刊出版部门可以按照期刊自身的特点、定位及栏目的设置,向社会相关学科领域广泛征求稿件。

(2)增值链:科技期刊出版部门。增值链位于科技期刊信息传播价值链的中端,信息在这部分将实现增值。对科技期刊来说所谓信息增值是指由编辑出版部门出好每期刊物,读者利用的信息并不是仅限于单篇的信息,而是将相关信息综合形成的新信息价值要大于原有各个单篇信息,从而实现信息增值。实现信息增值要求,一是读者获取期刊信息具有便捷性,二是科技期刊出版部门提供的期刊信息具有创新性。增值链的管理目标就是通过对科技信息的有效传播,体现信息的自身价值,并使无序的信息成为可以利用的有序信息,实现信息增值的最大化。编辑通过审读、送专家评审、编辑加工、校对等工作,去伪存真、去粗取精,完善论文信息的学术性、科学性、创造性,使其达到出版要求。

(3)输出链:读者。输出链位于科技期刊信息传播价值链的末端,科技期刊的信息增值在此得以实现。读者是否满意科技期刊提供的信息决定了信息增值可否最终实现,输出链的管理目标就是了解读者需求,及时向增值链表达这种诉求,同时运用多种出版形式使读者对期刊信息价值认可并持续使用 。[4]也就是通过科技期刊的出版发行实现信息增值。

二、大数据对科技期刊信息传播价值链的影响

1. 供应链:作者

(1)信息智能采集。大数据在科技期刊出版中的应用可以解决传统出版价值链的信息共享不足问题,提高价值活动间沟通的有效性与及时性,有效降低价值活动的成本、提高价值活动的效率和期刊服务质量。如在获取稿源、信息采集方面可以通过网络期刊征稿启事、寻找有关约稿人和审稿人等;对采集的信息资源,要求作者在线投稿的同时,首先让其进行注册,包括职称、科研方向、在研课题等,由此编辑部可以建立一个作者数据库,该库不仅是编辑部的约稿对象(上游资源),也是编辑部宣传、推广的对象(下游资源)。[5]同时运用编辑部办公管理系统对来稿进行编号登记、送审、个性化自动答复,作者也可以随时上网了解自己的稿件处理状态,由此提高作者与编辑部的互动。这种方便快捷的投稿形式,极大地提高了作者投稿的积极性,有利于组织优秀稿源。

(2)信息智能分析。科技期刊编辑部门可以基于大数据平台引入人工智能计算分析工具,对作者来稿进行智能处理。首先,对作者进行评估即自动生成反映作者学术水平、学科领域知名度等特性的评估指数,使编辑部对投稿作者进行科学管理,即通过投稿作者的发文量和退稿量信息,统计作者的比例,同时对作者的期刊层次、被引次数等信息也进行统计,据此将投稿作者分为权威作者、高端作者和一般作者等层次类型,从而对不同层次作者的来稿进行个性化优先处理。其次,对来稿进行评估即自动生成反映来稿内容特性及分类的监测、分析和评估结果,通过在线文本分析工具,应用作者来稿关键词、题名、摘要等在国内外相关文献数据库对论文进行检索分析,进而了解来稿的时效性、选题热点、在学科领域所处的位置等,以判断稿件是否属于该学科领域的热门或重要选题。[6]其后,对学术不端来稿进行智能识别,如目前的清华知网学术不端检测系统已实现了对论文抄袭的检测,但这仅限于国内中文语言,今后还应有中外相关文献数据库的对比,实现跨语言抄袭或重复发表的检测。另外,同一学科领域的科技期刊可以共同搭建一个期刊编辑系统平台,以识别一稿多投。如国内情报界已有图书情报方面期刊的一体化编辑出版平台。

2. 增值链:科技期刊出版部门

(1)出版流程变革。应用大数据技术能够实现编辑操作流程的革命性变化,加快科技信息的传播 , 通过对海量信息的深层次加工 , 编辑出有序、有效的信息产品 , 实现科技期刊信息价值增值 。这不仅要求信息传播的技术工具或者手段、组织形态能够与先进的大数据技术相匹配,还要求编辑的理念跟上先进技术的要求,使传统型编辑向数字型编辑转变。编辑工作中许多过去难以控制、不能数字化的流程变为可控制、可用数据精确描述的作业流程;许多杂乱的手工加工模式转变为标准化、程序化的作业模式;许多隐蔽无序的编辑规则模式转变为统一有序的规范模式。

(2)时效性提高。基于大数据平台,科技期刊编辑出版部门可以对论文的审稿周期和出版周期进行有效的控制管理,进而达到编辑流程的可控化目标。如审稿工作,科技期刊编辑部门可以应用编辑部办公管理系统的三网融合技术,通过短信、微信、微博等移动通信工具自动提醒专家及时审稿,审稿专家也可利用移动通信工具登陆审稿系统,在iPad 或智能手机平台上进行远程在线审稿,这样审稿工作不受时间和空间的制约,极大地提高了审稿的效率。对作者而言,不仅可及时获知稿件处理信息,而且可以获得后被转载、被引用等情况的信息。

(3)非结构化编辑。大数据技术颠覆了科技期刊传统的编辑技术,即突破平面文本信息编辑的传统模式,实现由文字向声音、 FLASH、图像、音频、视频等非结构化编辑方向全方位发展, 具有超文本链接、全时化、数据库化、交互性等编辑特点, 实现由平面编辑向多媒体编辑的转型。多媒体可以以更加感性的信息形态呈现论文信息,可以利用计算机和网络技术生成平面和三维动画、全息图像、虚拟空间环境等,进而使信息传播效果最大化。 科技期刊出版彻底实现了数字化,论文字数既不受版面容量的影响,也不受媒体符号样式的制约。当然这也对科技期刊编辑水平提出了更高的要求,不仅要精通平面文字符号的编辑加工,而且还要掌握多媒体音频及视频信息的编辑技术。因此,技术成为编辑的立身之本,编辑必须在增加信息量、优化文字内容的同时,以大量精美、震撼、深刻的图片以及图片报道来吸引读者的眼球。

3. 输出链:读者

(1) 传播平台重建。大数据时代科技期刊出版介质由传统的单一纸质传播平台转为多样化平台共存的传播模式,除了纸质传播平台还包括期刊网站平台、综合性或专业性数据库平台、iPad 及iPhone 平台等,从而实现了科技期刊全媒体信息传播。 与以往的传统媒介不同, 网络这种双向型、去中心化的媒介为读者获取信息与交流提供了种种便利。[7]此外,大数据将改变传统科技期刊以编辑部为单位的平台模式,打破这种各自为政的管理形式, 如开发建立新一代的科技信息资源平台,这个平台可以将科技期刊信息资源、信息分析工具和专业的信息管理软件整合在一起,使其兼具知识的检索、获取、分析、评价、管理与发表多项功能。[8]如万方知识服务平台就兼具上述功能,可帮助完成论文的选题、发表、分析、评价等,这种新型的科技期刊共同体形式,能够实现科技信息资源的优化与共享,形成以科技期刊为纽带的科学研究、协同创新、互动的全流程、全媒体传播, 对科技期刊信息传播价值链的各个环节产生积极而广泛的影响 。

(2)个性化服务。与传统媒介的传播方式点对面 不同,大数据时代使点对点传播成为可能,也就是通过网络能够为个体量身定做,提供它所需要的有关信息,做到个性化服务。科技期刊出版部门应对读者进行细分,针对不同读者的信息使用行为、需求、习惯、特点,提供个性化的信息产品,从而提高信息价值输出的有效性。在提供个性化服务技术方面,数字内容个性化定制平台应该实现与各种终端(包括手机、iPad 等)和社交媒体(如微博 、 微信 、 QQ 等)的无障碍连接,优化读者的阅读体验。目前一些科技期刊如《分析化学》《软件学报》《脊柱外科杂志》等纷纷开通了微信公众平台,通过定期向读者推送消息,一方面实现对读者的个性化服务;另一方面,读者可以将自己喜欢的文章发到朋友圈中共享,积累的人气又可发展成为期刊订阅用户。

结 语

综上所述, 大数据在技术创新和信息服务方面的优势将对科技期刊信息传播价值链产生重大影响与变革,为科技期刊的发展带来广阔的空间。通过大数据技术,可以对科技期刊的信息优势加强管理和利用,使科技期刊的传播方式和发展模式发生改变,也将带动编辑角色和功能的转变。目前大数据技术还处在起步阶段,在对大数据的有效运用方面,中国科技期刊与国外科技期刊处在同一起跑线上,因此,我国科技期刊界同仁应当抓住机遇,正视大数据、追赶大数据、应用大数据,不懈努力就有可能探索出领先国际水平的科技期刊发展新路径。

参考文献:

[1] 李国杰,程学旗. 大数据研究: 未来科技及经济社会发展的重大战略领域――大数据的研究现状与科学思考[J]. 中国科学院院刊,2012(6):647-656

[2] 百度百科.价值链理论[EB/OL].http:///link?url=loee2Ldei-GC0BFPp3h67DZfximdILA1b_qeSmoNHuXB2qJAcjGO4Q3WAM8Rq-6Z,2014-04-20.

[3] [4] 邹立君,侯胜超. 图书馆的信息价值链分析[J]. 图书馆学研究, 2010(13):15-17.

[5] [6] 吴锋. 大数据时代科技期刊的出版革命及面临挑战[J]. 出版发行研究 ,2013(8):66-70.

[7] 方岩,王雁. 信息技术对科技期刊传播价值链的影响与变革[J]. 杭州师范学院学报:社会科学版,2005(6):116-118.

大数据技术论文范文第4篇

关键词:电子商务 安全技术 符号 四则运算 VB程序源码

中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2013)11-0175-02

1 前言

电子商务交易系统的安全性是非常重要的一项内容。其中包括数字签名、数字身份认证、数字加密解密等主要算法。在这些算法中分为两大类,一类是对称加密解密,另一类是非对称加密解密。另外在所有算法当中有相当一部分算法的处理过程是建立在计算机大数运算的基础之上。例如:标准对称加密解密算法是DES、标准非对称加密解密算法是RSA。计算机安全则是确保交易过程的真实、完整和有效。相当一部分计算机安全技术的基础就是大数计算。所谓大数指的是超出计算机字长的一种数值计算方式,例如使用VB设计程序时数据是保存在变量中,使用的变量分为不同类型,其中包括字节型Byte占用一个字节,处理数据的取值范围在0-255,整型Integer占用两个字节,处理数据的取值范围在0-65535,长整型Long占用四个字节,数据处理的取值范围在0-4294967295,双精度Double占用八个字节。所以使用变量表示数据或进行数据运算时最大的数据使用Double型占用八个字节共64Bits,如果处理的数据长度在64Bits以下可以直接使用变量直接进行运算,如果处理的数据长度超出64Bits,就无法使用变量直接进行运算,而必须设计出相应的算法模型。

2 二进制带符号整型数组

在上一篇论文《电子商务交易系统安全技术实现方法研究----任意长度数值无符号整数四则运算》中阐述过,进行计算时首先要将二进制字符串转成用于计算用的二进制整型数组,然后再针对数组进行四则运算,本文同样需要进行数值转换,只不过在转换的同时要考虑数值的符号,为此我们将为二进制整型数组绑定一个字符形变量(在此我们它称之为符号变量),该变量用于保存数值(二进制整型数组)对应的符号,该变量内容只有两个,一个是“+”号表示保存的是正数,另一个是“-”号表示保存的是负数。

在通常的程序当中进行数值计算时,数值数据的符号保存在数值变量的高位,高位为0表示正数,高位为1表示负数。传统系统无法直接使用数值变量,所以必须设计出相应的算法。其处理方式如下:

原始数据由两部分组成,符号加上二进制字符串数据(例:+10110)。

本文设计的带符号数值数据转换就是将原始数据进行分解。取出原始数据的第一个数字符号保存在符号变量中。剩下的二进制字符串用上一篇论文的转换程序“binstobinv()”将其转换成二进制整型数组。为了表示转换过程的完整性,文中设计的转换方式有两种,一种是将带符号的二进制字符串转换成带符号的二进制整型数组,另一种将带符号的二进制整型数组转换成带符号的二进制字符串(详细过程略)。

下面是两个转换子程序,一个是有符号的二进制字符串转二进制整型数组,另一个是有符号的二进制整型数组转二进制字符串。

除法处理方式:直接调用无符号除法子程序Longdiv()计算除法的商和余数。符号相同商的符号为正“+”,符号不同上的符号为负“-”,余数的符号与被除数的符号相同。

4 结语

有符号大数运算的基础依然是无符号的运算,其变动部分只是对符号的处理。在所有的程序模块还设计了一些为了简化程序的模块,例如:longcmp()比较模块,longcpy()拷贝模块,longset()初始化模块,longdep()移动模块等。

当前论文是系列论文的第三篇“任意长度数值有符号整数四则运算”,前两期《数字技术与应用》发表了“任意长度数值数制转换”和“任意长度数值无符号整数四则运算”。后续论文还有第四篇“任意长度数值实数四则运算”。在系列论文全部发表以后欢迎读者向作者索取VB程序源码。希望读者能够继续关注《数字技术与应用》。

参考文献

[1]衷仁保著.《计算机代数学》.科学出版社

[2]BruceSchneier著吴世忠译.《应用密码学》.机械工业出版社.

[3]冯萍著.《汇编语言与接口技术》.机械工业出版社.

大数据技术论文范文第5篇

关键词:大数据时代;科技期刊;出版;编辑

中图分类号:G232 文献标识码:A 文章编号:1672-8122(2016)03-0105-02

20世纪80年代初,著名未来学大师及社会思想家阿尔文・托夫勒(Alvin Toffler)便预言大数据(big data)将成为“第三次浪潮的华彩乐章”。20世纪90年代以来,随着计算机技术的迅猛发展,上至国家的重大决策,下至人民生活的衣食住行,方方面面的信息均被数字化,并得到有效的储存。迈入21世纪,人类社会进入了一个大规模生产、分享和应用数据的时代――大数据时代,它强调信息技术的重点由“技术”转变为“信息”。因此,在以信息为基础的人文社会科学研究领域,大数据势必引发其组织决策和业务流程等方面的根本性变革。而为学术研究服务的科技期刊在大数据时代浪潮中,又将面对怎样的机遇和挑战呢?

一、大数据的概念与特征

大数据,又称为巨量资料或海量资料;其是由数量巨大、结构复杂、类型繁多的数据资料构成的数据集合,是以“云计算”为基础技术支持的数据处理和应用模式。大数据技术是通过集成共享数据,将分散的数据资源转变为集中的智力资源和知识服务能力。研究机构Garter定义“大数据”为需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资源。简而言之,从各种类型数据中,快速获得有价值信息的能力,就是大数据技术。

大数据的特征通常表现为以下四个方面:数据体量巨大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)。这就是人们通常所说的大数据的4V特征,也是大数据区别于传统数据的显著特征。

二、大数据时代下科技期刊面临的机遇

1.出版形态的多样化。大数据时代,在计算机、互联网等技术的不断发展和创新环境下,传统科技期刊的出版模式已悄然向大数据平台、多媒介及全媒体模式转型。科技期刊数据化集群建设得以实现的一个重要条件就是大数据技术的成熟与推广,随着大数据平台技术的建立,科技期刊实现了内容的自主优化、信息服务的个性化,以及出版发行模式的多元化,科技期刊将向着在线投稿及评议系统、编辑管理系统和增值服务系统一体化的方向发展。大数据期刊平台的构建将通过期刊内容推荐系统、流计算、期刊数据库和期刊信息整合与治理四大功能板块完成[1]。大多数科技期刊所采用的纸质媒介,在大数据时代背景下已不能满足读者的阅读体验,网络、无线、手持阅读器的全媒体出版要求凸显。传统纸质科技期刊传播媒介将呈多样化、全媒体的发展态势,物联网、互联网、移动智能终端等技术平台,都已成为科技期刊传播的重要媒介。科技期刊利用数字化、多媒介、全媒体的出版模式,在为读者提供平面媒体与数字媒体相结合的全新视听阅读感受的同时,也获得了更多途径和更深层次的推广效果。

2.业务流程的智能化。随着计算机技术的迅猛发展,以及云计算技术的成熟,使得任何复杂的数据都可以实现定量化分析[2]。因此,导致编辑工作流程中的信息收集、加工、传递等过程的智能化成为可能。科技期刊编辑的目标是将知识差大,且读者或该领域从业人员感兴趣的论文从众多稿件中挑选出来,体现在编辑出版过程中就是组稿策划和审稿过程[3]。而过去这一编辑流程基本依靠编辑人员的经验、价值观或学术专家提出的建议完成。而现在大数据技术将科技期刊历史出版物数据化,将全社会、全行业的科技成果数据化,并将这些数据进行整合、分析,从中获得真实、客观、准确、全面的学术信息,从而为科技期刊的选题策划、组稿及审稿提供依据。可以想象在大数据技术提供的真实、客观、准确、全面的学术信息下,那些“一稿多投”或学术不端、学术腐败的问题稿件,将无处遁形。在信息的加工过程中,大数据及云计算技术将过去编辑流程中,因编辑习惯不同或各期刊要求各异,而无统一标准的编辑规则模式转化为统一、有序的编辑规则模式。在这种编辑规则模式下,利用人工智能工具或软件,有可能实现稿件的计算机“预编辑”。从而减少编辑的重复劳动和简单劳动,提升编辑质量和编辑效率。

3.评价规则的多元化。目前,对科技期刊及论文的质量和影响力的评估,普遍采用基于文献计量学的评价体系,如影响因子和被引频次。然而,由于模拟数据时代采集的数据样本量小、种类少,导致科技期刊界对定性或定量评价的优劣争议不断[4]。大数据时代的到来解决了这一问题。通过文本分析、语义分析、专家印象评估及同行评估等方法,可以实现对科技期刊的定性评价。通过期刊影响因子动态跟踪、论文被引动态跟踪、论文浏览及下载量动态跟踪等方法,可以实现对科技期刊的动态评价。通过专家反馈信息采集、同行引用反馈信息采集、读者反馈与推荐信息采集、厂商应用效果市场反馈信息采集等方法,可以实现对科技期刊客观评价。因此,基于大数据平台的科技期刊及论文评估是定性与定量、历史与现代、静态与动态、学术价值和经济效益、主观与客观相结合的多元化、综合性科学评价机制[5]。

4.营销模式以品牌营销为主。大数据时代科技期刊的营销模式是将文化价值、创新价值、版权价值和广告价值融为一体的新型商业模式。文化价值即科技期刊的学术品牌,是科技期刊建设的最主要目标,有文化内涵、科技含量及艺术价值的品牌形象,不仅保证了科技的发展和文化的繁荣,更是吸引读者的关键,从而获得更好的经济效益和社会影响力,实现科技期刊的良性发展。创新价值即是以创新为突破口的跨媒介融合出版,利用大数据技术获取受众群体的核心信息,通过大数据分析掌握市场动向,并及时提出有创新性的营销策略,是科技期刊出版单位需要具备的专业能力。印刷时代建立的传统版权原则和制度,在大数据时代受到了根本性动摇,传统版权规则所确立的利益观、价值观,以及商业模式也被逐渐解构,特别是随着数字出版的蓬勃发展,版权资源潜在的巨大市场和价值被重新挖掘和开发。版权产业迎来了前所未有的发展机遇,版权资源成为争夺主战场,版权资源的价值亟须重塑[6]。大数据时代,出版载体已向跨行业全媒体模式转变,出版形态也更加丰富,广告形式不仅仅局限在传统期刊投放的平面广告,声音、动画、影像等多媒体形式的广告将有效地与科技期刊的主题报道内容相结合,读者在阅读杂志内容的同时,也反复接受了产品的展示与推广,加强了品牌宣传效果,真正达到广而告知的目的。

5.出版编辑理念面临的机遇。在大数据时代背景下,要求科技期刊的编辑工作从传统的文字编辑加工,转变为全媒体新出版语境下的数字编辑。数字编辑的定义是:在数字图书、数字报纸、数字期刊、网络原创文学、网络教育出版物、网络地图、数字音乐、数字视频、网络动漫、网络游戏、数字音像制品、手机出版等出版过程中,从事选题策划、组织稿件、审核把关和加工整理的专业技术人员[7]。这就要求科技期刊编辑首先从思想上树立数字编辑理念,深刻理解大数据时代,数字出版背景下编辑工作不断追求创新和数字技术应用的要求。科技期刊数字出版编辑在推广重要学术成果、传播科技文化知识、促进科技期刊发展进程中,不仅是实现期刊全媒体化的先行军,更是数字出版技术创新的开拓者。数字出版编辑应顺应数字出版的潮流,更新数字化出版的编辑理念,主动参与文化、科技成果的数据化,并积极实现数字信息的加工与传播。在读者服务方面,编辑也利用大数据技术提供的精准信息,实现对目标消费群体的个体化信息推送,提供更为精准服务。数字出版编辑要不断适应数字理念的创新,以适应大数据时代不断深化的移动互联网终端输入内容智能化的趋势[8]。

三、大数据时代下科技期刊面临的挑战

1.信息透明化导致期刊生存环境竞争激烈。通过大数据技术,所有科技期刊都将在一个更为透明的环境中生存。所有科技期刊的评价指标,都将作为公共信息,而被公之于众。例如,中国科学技术信息研究所每年都会将中国科技论文统计源收录期刊的主要计量指标,如核心总被引频次、核心影响因子、核心即年指标等,以引证报告的形式,提供给大众。在这些细化和量化的数据信息面前,科技期刊的优劣势一目了然。这必将造成优秀期刊的良性发展和劣质期刊的自我淘汰。这种数据公开机制,有可能导致某些优质期刊或优势学科领域的期刊获得更多的读者和作者资源,而对于新创办的期刊和某些弱势学科领域的期刊将进入一个更为不利的生存态势之中。

2.对科技期刊编辑人才队伍提出了新的要求。随着大数据理念深入人心,大数据技术的日臻成熟,数字化出版必将成为科技期刊的主要出版形式[9]。因此,数字化编辑也将成为科技期刊编辑工作者的新要求。编辑工作者不仅应具备组稿策划、文字编辑加工能力外,还应具备内容扩展、内容研究、内容创作等能力,以适应科技期刊在大数据时代下的数字化发展。

3.传统的盈利模式不再满足期刊的发展需求。在科技期刊数字化进程中,科技期刊文章无偿向全社会提供阅读已成为必然趋势。因此,依靠纸质发行、有偿下载阅读的传统盈利模式,已不能满足期刊的发展要求。然而,在将来期刊出版社或编辑部是否能成为数据运营的主体,也是一个悬而未决的问题。数据库运营商有可能通过与科技期刊共同建立和运行数字化出版平台,或开发数字化产品,来分享杂志的发行和广告收入。

由此可见,在大数据时代背景下,科技期刊将面临前所未有的机遇和挑战。作为科技期刊的从业者,我们要抓住这些机遇,迎接挑战,完成科技期刊的完美转型,尽早实现真正意义上的数字化期刊集群化。

参考文献:

[1] 丁田.大数据时代科技期刊的未来形态[J].中国科技期刊研究,2014(2).

[2] 贾晓青,王萍,陈清莲.大数据时代科技期刊编辑思维拓展[J].出版科学,2014(6).

[3] 张小强,张苹,吕赛英.从信息传播角度看科技期刊编辑出版过程及其优化[J].编辑学报,2007(3).

[4] 朱剑.量化指标:学术期刊不能承受之轻――评《全国报纸期刊出版质量综合评估指标体系(试行)》[J].清华大学学报(哲学社会科学版),2013(1).

[5] 柴英,马婧.大数据时代学术期刊功能的变革[J].编辑之友,2014(6).

[6] 张勤.试论大数据时代版权资源的价值重塑[J].中国出版, 2015(11).

[7] 李超.数字出版人才培养:职称评定的作用[EB/OL].中国数字出版信息网,2013-05-23.

[8] 李海峰.大数据下数字出版编辑的理念和职能创新探析[J].宁波 大学学报(人文科学版),2015(2).

大数据技术论文范文第6篇

>> 大数据关键技术及发展 投资统计大数据处理关键技术 大数据关键技术分析及系统实例分析 基于大数据的信息系统关键技术 浅析云环境下的大数据关键技术 面向大数据的Deep Web数据系统关键技术研究 大数据安全和隐私保护技术体系的关键技术研究 社会网络大数据分析框架及其关键技术 农业云大数据自组织推送关键技术综述 基于大数据的信息系统关键技术研究 云计算环境下的大数据可靠存储关键技术概述 电力信息大数据高速存储及检索关键技术研究 面向大数据的分布式系统设计关键技术研究 浅谈大数据基础理论与关键技术发展 大数据时代下软件工程关键技术分析 移动互联网的大数据处理关键技术 电力大数据可视化系统开发关键技术研究及趋势 电信运营商大数据变现之关键技术 移动通信网络中大数据处理的关键技术 面向智能电网应用的电力大数据关键技术研究 常见问题解答 当前所在位置:l.

[9] FastDFS [EB/OL]. [2012-10-02]. .

[15] Storm [EB/OL]. [2012-10-02]. .

[24] Hive [EB/OL]. [2012-10-02]. http://./conflunce/display/Hive/Home.

[25] Zookeeper [EB/OL]. [2012-10-02]. http://.

[26] Sqoop [EB/OL]. [2012-10-02]. http://.

[27] Flume [EB/OL]. [2012-10-02]. http://.

作者简介

王秀磊,理工大学在读博士研究生;研究方向为容迟/容断网络、软件定义网络、内容中心网络、网络测量和网络管理;已发表学术论文4篇。

大数据技术论文范文第7篇

关键词:图书馆 大数据 体系构建 学术环境 战略思考 分析 探究

中图分类号:G250 文献标识码:A 文章编号:1672-3791(2017)02(c)-0003-02

随着我国信息技术以及网络化的不断发展,信息量的增加和数据类型的增长已经逐渐超出了人们的承受范围。这样一来造成的后果就是全球近80%的数据都没有得到真正的利用,而70%的数据都是非结构化的数据和半结构化的数据,最关键的是这一比例仍旧在不断增长当中。信息量也逐渐呈现出了指数级的增长,数据结构的复杂化逐渐脱离了人们的实际控制。在这样的一种大背景下,对图书馆的知识服务体系进行变更和完善是非常有必要的,而且对其进行更新也有助于以大数据为基础的科学研究和新型知识服务范式的形成,但是从目前的实际情况来看,现阶段实行的信息技术以及信息管理模式并不利于大数据的获取和形成,最主要的是它还面临着技术落后、人员队伍不适应重大灾难性危险等问题。

再加上已有数字图书馆的相关建设需求以及构建模式都面临着被新知识服务需求与服务模式所取代的危机。数据量的不断增长也使得数据的结构变得日益复杂化,使得图书馆的知识服务体系逐渐成为半盲区。因此在这样的时代背景以及图书馆发展背景下,开展图书馆大数据体系构建的基础理论与实践研究工作是非常有学术价值的。

1 大数据体系构建的学术环境

1.1 发展历程

大数据这一概念由来已久,其发展历程非常独特,我们这里所说的大数据并不是指海量的数据和超大规模数据,但是从字面上分析的话,其实二者之间的区别不是很大,从数据管理技术发展的角度来分析二者之间的联系,对于研究人员进一步理解大数据的概念以及相关的技术问题都是非常有帮助的。

1.2 大数据理论与应用研究发展

从数据发展的历程角度就断定大数据的出现是不客观的,研究人员还需要从更多的角度和层面来考虑大数据这一全新的理论技术,笔者此次主要对大数据理论与应用研究发展进行详细的分析,以此来感受大数据体系构建所处的学术环境。虽然说大数据技术与实际理念之间的冲击的确能够让图书馆知识服务受众、供应者以及运营者本身得到充分的体现,而且还能够通过对结构化以及非结构化数据的常规分析,实现对图书馆知识服务创新能力的有效性分析。但是大数据对于图书馆来说,并不意味着所有,也不是一蹴而就的,一般大数据处理以及管理技术都是处于诱发阶段,距离真正投入到实施中还有很长的一段时间,也就是说二者并不是等同的,这段时间是研究人员建立图书馆大数据体系的重要阶段,同时也是图书馆研究人员非常重要的缓冲时期。

2 图书馆大数据体系构建战略思考研究

2.1 大数据对图书馆的影响

在对大数据进行分析和应用的时候,研究人员就要首先考虑图书馆大数据体系构建以及图书馆的信息职能服务问题,目前我国对大数据工程技术的研究已经领先于大数据科学研究,而大数据科学研究也走在了大数据知识服务体系的前面。当前,很多工程领域专家都是以自我的认知为中心来处理图书馆领域的大数据信息。而信息领域的专家则起到辅助的作用,在与应用领域的科研人员进行合作的时候,主要解决的是应用领域大数据处理的相关技术问题。而信息服务领域的专家则暂时独立于大数据知识服务体系之外。这样一来也就使得大数据知识服务体系的运用被推迟了5年左右。也正因为如此,图书馆大数据问题成为了当前研究的热点问题。

由此可见,如果想要研究大数据对图书馆的真正影响,就绝对不能简单地将图书馆看做一个单独的个体进行分析和讨论,而是要结合图书馆当前所处的学科背景以及研究背景等多个方面进行综合考虑。

大数据对图书馆的影响并不是单纯地体现在技术手段上,由于图书馆所处的时代背景和学术背景都属于有机整体,而大数据理论与应用研究对整个图书馆的影响是由内而外的,所以说大数据对图书馆的信息资源以及图书馆领导以及管理者甚至建筑设备都会产生直接的影响。

2.2 图书馆的相关应对措施

在大数据的引领下,图书馆运营体系也迎来了全新的机遇和挑战,图书情报领域要从自发到自觉、局部到整体,全方位地实施管理应对措施。只有这样才能够有效地应对当前图书馆大数据体系构建的实际社会需求以及科研发展带来的挑战。图书馆要想合理地构建大数据生态体系,就一定要做好以下应对措施。

第一,图书馆的领导层和管理人员在制定大数据的全局战略规划时,一定要根据不同的情况来创建大数据战略角色定位,并结合图书馆所处的实际地理位置,综合各方面因素来制定分层、分级的实施策略,进而有效协调,创建大数据知识服务纲要。

第二,图书馆一定要在思想意识形态以及技术手段、服务技能等方面进行全面的提升,我们的图书管理人员除了要掌握图书馆学、信息管理学等专业的理论知识以外,还要熟练地掌握信息科学、教育学、心理学等学科知识,尤其是大数据、云计算、移动互联网等基础的理论和技术。进而树立一个嵌入式的知识合作服务理念。

第三,研究图书馆大数据体系构建的要素以及驱动因素主要是从环境架构、战略架构以及业务架构等方面来探索图书馆大数据体系构建的相关理论及应用研究,探究图书馆在促进大数据科研发展中应该发挥的具体作用和地位。

第四,研究人T还要研究支持图书馆大数据体系的知识服务环境。作为集数据、工具、平台等于一体的知识服务环境,除了具备学术搜索、知识服务行为分析以及决策等功能以外,还要实现与传统图书馆自然环境、人文环境以及技术环境的无缝对接。

第五,按照图书馆大数据的数据全生命周期来进一步实现图书馆大数据的获取、存错、组织、分析等功能,结合大数据的来源以及用户的实际服务需求来解决主要的技术型问题,进而提出科学系统的基础理论体系。

第六,我们还要研究图书馆大数据的技术型人才以及服务型人才的主要培养方案,着重分析这类人才的知识结构以及专业技能,将培养计划真正付诸实践,为今后图书馆大数据体系构建提供有用的人才,除此之外,还要从大数据的源头抓起,进一步提高全民的数据素养以及数据的方法和方式。

2.3 ν际楣荽笫据体系构建的几点思考

从客观的角度来说,目前还是有很多人对大数据产生质疑,正如图书馆技术出现之后,图书馆界也出现了很多质疑的声音,认为图书馆技术在今后的发展中不会占据任何优势,而图书馆人员在研究大数据的时候也同样遭受到了此类质疑,基于此,笔者针对图书馆大数据体系构建阐明以下几个观点:(1)大数据体系只是一种全新的图书馆管理体系,它并不代表对图书馆所有的传统信息服务模式和信息技术都进行替换,大数据体系主要是在已有的信息服务模式基础上,对信息技术和人文情怀进行完善和补充,就好比我们将当前的数字图书馆、移动图书馆以及云图书馆进行整合。大数据体系作为信息资源管理技术的标准,并不意味着后续的技术会完全取代传统技术手段,技术体系以及人文情怀的渗透和融合在大数据体系中的运用也是非常有意义的。(2)在面对大数据的挑战时,图书馆领域有责任承担起图书馆大数据体系构建的重任,尤其是图书情报领域中处于一线的科学技术研究人员以及图书馆情报学家,他们的贡献和付出使得图书馆的整体发展有了极大的进步。

3 结语

我们这里所说的大数据不仅是数据量的增长,而是信息技术的更新和人类对客观世界认知程度的不断提升,对大数据基础理论知识的应用进行有效的分析和研究将会极大地推动图书馆情报学等学科的发展,而且也为社会以及所服务的机构提供了更加先进的知识服务机会,但是需要注意的是,我们所面对的不仅仅是图书馆新型知识服务体系构建上的变化,还要综合考虑由量变到质变,由局部到整体的图书情报领域观察模式的转变,大数据有可能会引起图书馆生存方式以及生存方法上的改变,所以我们一定要充分发挥自身的知识水平,支持图书馆大数据体系构建的基础性研究,不断增强学科内以及学科之间的学术交流。

参考文献

[1] 冯晴君.“云图书馆”环境下的地方文献工作新模式――以“贵州数字图书馆”和“珠江三角洲数字图书馆联盟”为例[J].贵图学刊,2012(3):1-3.

[2] 蔡津津,郜新鑫,付建俐.基于业务元数据标准化的金融财经数据仓库及服务系统架构探讨[C]//中国新闻技术工作者联合会2012年学术年会、五届四次理事会暨第六届“王选新闻科学技术奖”的“人才奖”和“优秀论文奖”颁奖大会论文集.2012.

[3] 张丽丽.科学数据与数据科学小议[C]//安徽首届科普产业博士科技论坛――暨社区科技传播体系与平台建构学术交流会论文集.2012.

[4] 王红会.图书馆动态WEB数据库应用[C]//图书馆改革与发展――陕西省社会科学信息学会第六次学术讨论会论文集.2003.

[5] 张侠.浅谈现阶段图书馆的数字化建设[C]//陕西省图书馆学会第五次会员代表大会暨学术研讨会与全国图书馆部室主任工作、学术研讨会论文集.2003.

[6] 闫贵恩.回顾与展望――中国图书馆事业百年――图书馆数字化与现代化服务[C]//中华医学会第十次全国医学信息学术会议论文汇编.2004.

[7] 贾怀忠.高校图书馆电子阅览室的建设与管理[C]//拓展与深化――全国民办高校图书馆与图书馆地方文献工作研讨会论文集.2005.

[8] 支晓红.新建高职高专院校信息资源建设的策略[C]//拓展与深化――全国民办高校图书馆与图书馆地方文献工作研讨会论文集.2005.

[9] 郭嘉.浅谈新时期高校图书馆网页制作[C]//图书馆与人文精神――陕西省社会科学信息学会第八次学术讨论会论文集.2006.

[10] 熊筱熙,赵欣艳.商业视角的云计算服务研究综述[C]//宽带中国战略与创新学术研讨会论文集.2012.

大数据技术论文范文第8篇

关键词:大数据生态翻译学新生态

中图分类号:H059文献标识码:A文章编号:1009-5349(2017)02-0011-02

在2015年第五届国际生态学研讨会上欧洲翻译学会会长Anthony PYM教授指出,“作为已经意识到西方思维缺陷的欧洲翻译研究协会的代表。我欣然接受生态翻译学这一异质理论、并探索它与西方翻译理论的区别。在生态翻译学中我发现了一套非西方的、而且对西方学者很有吸引力的构想。”Anthony的言论表明了他对生态翻译学的肯定。中国拥有丰富的翻译人才,但是在国际翻译界却是长期丧失话语权的,这不能不说是非常遗憾的。而生态翻译学的出现,无疑弥补了这一空缺。目前,生态翻译学不但有了自己较为完整的话语理论体系。而且研究队伍也在不断壮大。每年都有相关论文在海内外发表,生态翻译学研讨会也连年召开。且尽管生态翻译学肇始于中国。但已开始受到国际翻译界人士的关注。在大数据飞快发展的今天网络与计算机技术无疑会为生态翻译学的发展提供新的契机与渠道,相信生态翻译学会不断进发新的活力。迈尔・舍恩伯格及肯尼斯・库克耶(2013)在研究大数据背景下生活与工作等发生的巨大变化中提出大数据是采用所有数据进行分析处理,而不是用随机数据分析来研究问题。随着翻译理论的不断更新和完善,生态翻译学应运而生。清华大学教授胡庚申(2001)在国际译联第三届翻译家论坛上宣读了第一篇关于生态翻译学方面的文章。文章中的理论和思想为完善翻译适应选择论系统提供了理论基础。当然,翻译适应选择论的发展也促进了生态翻译学的发展。由中国学者首次提出的具有中国本土化特色的原创性翻译理论,理应受到我们更多的关注、完善和推广。

一、生态翻译学研究状况

生态翻译学是依托生态智慧和东方哲学理念发展起来的一种新的翻译理论。这一新的理论产生对译学理论研究起到了促进的作用。胡庚申于2001年首次提出生态翻译学并不断发展完善。在此。分两个阶段对其分析研究状况和发展趋势。

1.萌芽阶段(2001-2009)

在萌芽阶段主要体现为胡庚申教授首次提出生态翻译学理论的概念,随后,自己便独自构建该理论。当然,在理论构建的过程中,也有很多专家学者参与讨论。为了更系统地介绍生态翻译理论,胡庚申教授(2004)出版了《翻译适应选择论》,这本专著详细介绍了翻译适应选择论的产生背景和相关的基本理论。大胆结合达尔文进化论的核心思想,并将这种思想引入到翻译学领域。胡庚申教授在研究过程中采用了实证研究方法和文献性研究方法相结合的方式来全面系统地构建生态翻译学的理论框架,例如通过文献的阅读分析来证明和阐释,通过实证调查来对理论进行丰富和完善。当该理论被提出后,参研者也越来越多,在此时期就已经受到较多的认可和关注。相关学者在研讨会上发表了自己的看法和主张。也以学术论文形式发表在学术期刊上,并对生态翻译学持高度赞扬的态度。通过统计可知。在2001-2009年间公开发表的生态翻译学相关理论的学术论文已超过40篇。其中硕博士论文所占比例已超过20%。同时,天津理工大学许建忠教授(2009)出版了《生态翻译学》这本著作。

2.发展阶段(2010-至今)

2010年11月在中国澳门召开了“首届国际生态翻译学研讨会”,该会议由国际生态翻译学研究会主办。生态翻译学的发展不仅体现在学术成果数量上。也体现在该理论研究不断成熟。研究队伍不断壮大,以胡庚申为领军者,更多的高校及其研究所的研究人员开始投入到这一理论的研究中,学术论文成果不断增多,很多人获得相关理论的研究课题立项。国内外也会针对生态翻译学理论组织学术会议,伴随着会议的影响程度越来越大,《生B翻译学刊》也成功创立,生态翻译学的影响范围也在不断扩大。高校的老师和硕博士成为研究生态翻译学的主力军,在核心人物的影响下,周围的人群纷纷加入这一领域的研究中。通过期刊网站的搜索可知,相关的硕博士论文已超过600篇。生态翻译学是通过跨学科的方式建立的研究模式,从生态学的角度对翻译的研究进行创新。在发展的过程当中,生态翻译学的研究内容主要有以下几个方面。其一,相关理论系统构建和完善。胡庚申教授经过十多年理论与实践相结合的研究,可以说已经比较全面、系统地阐释了生态翻译学理论。该理论在不断完善的过程中也得到了很多专家学者的赞赏和认同。其二,基于生态翻译学角度对译文文本分析研究。通过检索可知,硕博论文在运用生态翻译学的理论时,大多采用对某一译文文本进行分析研究。其中,文本类型各异。既包括中国的四大名著也包括电影片名和字母,比如《红楼梦》《论语》《金陵十三钗》等。其三,对翻译家特有的翻译思想进行实证研究。有对傅雷先生的翻译思想进行探讨的。也有对结合生态翻译学的核心思想对一代宗师张谷若的翻译理念进行解读的。其四,对外语教学的相关研究。生态翻译学的研究者中有很多从事高校外语教学的教师。他们运用该理论分析翻译教学方案,并对翻译专业教材提出了建设性意见。

尽管生态翻译学的研究不断成熟。相关理论也在不断完善和发展,但是仍然存在一些问题。其一,作为一个新的理论,而且仅由胡庚申教授个人提出和构建的理论框架,参与该理论的讨论并作出重大贡献的人员甚少,因此理论的系统性有待加强。其二,应用研究缺乏创新。很多人在运用该理论进行分析问题时。模式固定,涉猎对象广而不精,研究价值和意义不大。研究方法不够科学。其三,在实证研究方面,缺乏科学的统计分析和相关检验研究。基于以上的背景和生态翻译学存在的问题。故结合大数据来构建翻译新生态。

二、大数据下的翻译新生态构建

在当今大数据背景下,虽然关于生态翻译学的研究发展迅速,并且初步形成了其特有的研究方法与体系。但是其研究思路和基本结论往往只是针对传统的翻译行为,对于网络方面等新的翻译手段的研究却相对缺乏。随着科学技术的不断发展和进步。新技术和新工具也纷纷进入了各个行业和领域,而翻译则充斥在各行各业。随着翻译技术的不断更新。相关的翻译理论和翻译模型也在不断完善和重塑。站在生态翻译学的角度对文本进行分析是相关理论主要的研究内容之一。而大数据时代的到来。可以为文本的分析和选择提供便捷,从而提高效率。大数据可以解决在研究过程中信息存储和读取的困难。并且可以在海量的数据中帮助我们迅速找到所需的相关数据信息。在丰富的数据信息中,既可以得到研究对象的原文文本,也有各种译文文本,信息获取方便快速。当然,网络上并非所有的译本信息都是无偿的,需要一定的资金付出,面对这种情况,可以通过多种渠道,搜索免费资源。通过长期积累的文本资源,可以建立自己的分析对象和研究目标。网络信息呈现出指数爆炸式增长趋势存在着一定的风险。在使用过程中会不断掌握技巧和避免风险的方法。运用生态翻译学来研究译本文本时,利用大数据可以提高效率,使分析的内容更为丰富,研究的深度不断拓展。同时,在研究过程中避免固定模式,增加创新之处。

大数据分析技术的运用可以弥补生态翻译学在实证方面的缺陷。大数据背景下的云计算可以高效收集和整理各种资源,分析出具体的研究结果。随着信息化的不断发展,大数据时代的云计算应用也在不断推广。通过科学的统计分析,在相关的实证研究中可以从多方面、宽领域、多层次进行考虑,使得生态翻译学视角分析结果更为科学合理。建设一个大数据的网络管理平台。将信息化的文本资源和翻译理论投入到生态翻译学的研究中。根据理论的不断完善更新,平台的建设也应与时俱进。在建立大数据分析平台之后。运用生态翻译学理论对之前的实证研究进行再次研究,形成对比,监测是否更加科学。平台的建设的运行虽然由电脑执行命令,但是传递的是人的逻辑思路和判断Q策。因此,研究者可以一次输入相关程序,进行多次的相关研究,大大减轻了研究人员的劳动强度,也提高了研究结果的准确性。大数据时代的信息技术不但为理工科的科研带来了福音,也为社会科学的研究提供技术支撑。大数据技术也将为更多的翻译理论带来一次次的革新,对翻译研究产生更深远的影响。大数据下翻译新生态的构建,也对生态翻译学研究者提出了更高的要求。不但要精通本领域的知识,也要加强计算机技术的知识储备。

三、结语

大数据技术论文范文第9篇

大数据时代科技期刊的传播媒介将是多样化的,传播范围更广,传播速度更快。科技期刊可以通过互联网、物联网、移动智能终端以及社交网络等搭建交流平台,实现纸媒科技期刊和网络学术数据库资源同步以及无时间限制、无地域限制的资源共享。在这个平台上,学者可以更方便地获取各领域的学术资源,随时随地发表个人学术成果,与其他学者进行学术探讨及交换意见等。大数据更易满足用户需求,更好地提升了用户体验:一些国外期刊与facebook和twitter等集成,深化了期刊的服务内涵;也有一些期刊增加了数字技术,例如读者可通过扫描期刊上的二维码观看一场手术视频等。这些全新资源使学术交流更加便捷、更加个性化,同时也推动了学术研究成果的传播。

就大数据时代而言,青年编辑具有一定的优势,主要体现在:

①青年编辑对互联网、物联网、移动智能终端以及社交网络等平台较为熟悉,运用起来更得心应手。

②青年编辑的思维敏捷、思想活跃,好奇心更强,适应新事物、学习新知识的速度更快。正因为青年编辑具有新时代的种种优势,所以更应该不断学习,不断完善自我,从而适应新时代的要求。

大数据时代对于青年编辑而言既是机遇也是挑战。青年编辑要积极探索新技术在收发稿件、编辑加工、稿件校对、图文编排等编辑出版环节中的应用,利用新的技术和手段提高编校效率、拓宽思路。为此,在基本编辑技能和专业知识的基础上应具备下列几方面的素质。青年编辑应该熟练应用一些基本软件:主要的绘图软件Visio、Origin7.0、Chemoffice、AutoCAD;图片效果处理的常用软件Photoshop、Illustrator、Coreldraw;数学公式编辑软件MathType以及排版软件Latex等。青年编辑要了解编辑行业不断更新的新技术:DOI作为数字对象唯一标识符,是云计算背景下最佳的“大数据”样本存储和应用技术;CrossRef推出的CrossMark可使读者了解该篇论文的“前世今生”,包括这篇论文是否更正或修改过,哪篇博客或哪些媒体介绍过该论文,以及该论文被下载的次数等;ORCID使作者能够跨学科、跨机构地将自己的身份连接到研究对象,如数据集、设备和引文等,且该身份是唯一的;Cited-by引文追踪服务可以使出版商和作者了解该论文或期刊的引用情况;FundRef主要用于资助情况(机构、项目名称等)的规范化,也可让资助者了解产出情况。青年编辑应熟练地掌握和应用英语,只有具有一定的英语阅读和英语写作能力,才能迅速地了解并跟踪国际学术发展的走向和国际科技期刊的前沿信息,及时发现并纠正英文摘要和英文题目中出现的错误并检查英文文献的引用是否恰当,才能使科技期刊与国际接轨,提高期刊的影响力。

二、积极面对改革

在我国科技期刊编辑还埋头于日常繁琐的编辑业务时,国外期刊的经营模式和出版方式已经发生了翻天覆地的变化。我国期刊这种规模小、实力弱的发展状态已经无法适应当前的“国际化”趋势,更无法与国际出版集团相抗衡。为此,、教育部、原新闻出版总署等一直在积极推动科技期刊改革。面对不断深化的体制改革,青年编辑的首要任务是转变思想观念,认清科技期刊的改革形势和政策环境,不再闭门造车,从传统的繁琐重复的工作中走出来,努力接受新事物、新思想,提高网络运用能力和计算机运用能力,只有这样才能为改革做好准备。

三、结论

青年编辑的队伍建设是关系到我国科技期刊整体质量和学术发展的大问题。踏实做好本职工作是每个青年编辑的基本任务,但若止步于此是远远不够的。我国科技期刊正在面临国际化的冲击和期刊改革的挑战,只有不断地学习,不断地完善自己才能在“转企改制”和国际化的新形势下,为期刊的发展“推波助澜”。

大数据技术论文范文第10篇

关键词:大数据智慧管理单套制档案数据开放

Abstract: The Thirteenth Five-Year Plan of the national archives development surpasses the previous any five-year plan in terms of archives information construction, outlines the prospect and develop? ment path of 2016-2020 archives information con? struction with the perspective of big data and the concept of open and innovation. This article decon? structs the new path of archive information con? struction from five aspects: firstly, stepping over the border of digital archives construction and sketching a blueprint of wisdom archives construc? tion; Secondly, extending the perspective of gener? alized electronic records and focusing on the busi? ness electronic records management development; Thirdly, getting out of trouble of the Two-Set Man? agement about electronic archives and making ex? periments on the single-set management; fourthly, surpassing the small data management and explor? ing the fusion with big data action ; Fifthly, Break? ing through the barriers of archives information dis? closure and stepping into open archives data.

Keywords:Big Data; Wisdom Management; Sin? gle-Set Management; Open Archives Data

一、《全国档案事业发展“十三五”规划纲要》信息化建设之新气象

我国档案事业发展五年规划从“十五”开始将档案信息化建设作为重要议题,但“十五”“十一五”和“十二五”这三个五年规划在信息化方面的突破不大,基本上围绕着电子文件归档与接收、档案数字化、档案数据库系统以及数字档案馆建设等方面进行目标和任务描述。然而,2016年国家档案局的《全国档案事业发展“十三五”规划纲要》(以下简称《纲要》)却让档案界为之振奋,尤其是《纲要》对档案信息化建设的重视程度以及在信息化建设的任务设计方面和以往的五年规划相比有了显著的突破与超越。

首先,《纲要》增加了“面临形势与挑战”的内容,突出了信息化建设方面的挑战:“电子政务建设极大推进和实现了电子n案的形成、管理;档案信息化与互联网利用成为发展趋势;云计算、大数据和移动网络技术的发展,给信息安全、隐私保护和数字记忆留存带来挑战。从国内看,‘四个全面’战略布局、国家大数据发展战略和‘互联网+’行动计划的推进,深刻影响档案工作的理念、技术、方法及模式……”“云计算”“大数据”“互联网+”这些时下最热门的技术名词出现在全国档案事业发展规划的文件中确属首次,彰显了国家层面档案部门对大数据时代新技术的重视。随之,国家档案局在《纲要》第三大部分“主要任务和实现指标”中浓墨重彩地规划了如何加快档案管理信息化进程,大数据、智慧管理、社交媒体、网页资源、单套单轨制等新概念、新技术充溢其中,展现了档案信息化建设开放、创新与包容的新气象,也表明了大数据时代新技术、新理念与档案信息化建设将深度融合。本文将《纲要》与以往档案事业发展规划中档案信息化建设内容进行比较,从五个方面解构大数据视阈下档案信息化建设的新路向。

二、突破与超越――大数据视阈下档案信息化建设新路向

(一)跨越数字档案馆建设边界,构建智慧档案馆建设蓝图

2006年,国家档案局在《档案事业发展“十一五”规划》(以下简称“十一五”规划)中首次提及“数字档案馆”,并在总体目标中提出“建立一批电子文件中心和数字档案馆”,在档案法制建设中提出“制定《数字档案馆建设规范》”,在档案信息化建设中提出“进一步推进电子文件中心和数字档案馆建设”。不难看出,“十一五”规划将数字档案馆建设作为档案信息化建设的重点内容推出。随着数字档案馆理论研究的深入和实践试点的展开,2011年《全国档案事业发展“十二五”规划》(以下简称“十二五”规划)对数字档案馆建设提出进一步的要求,主要目标中提出“加快数字档案馆及电子文件(档案)备份中心建设,完成国家数字档案馆建设总体规划的编制工作”;档案信息化工作任务中提出:“贯彻落实国家有关电子文件管理、数字档案馆建设的文件精神,加强以计算机网络设备和数据库为主要内容的档案信息化基础建设;根据电子文件管理和数字档案馆建设的功能要求,配备和开发档案数据库管理系统、电子文件归档管理系统、电子档案移交管理系统、数字档案信息利用系统……各级国家档案馆加快数字档案馆建设步伐,有条件的要完成数字档案馆建设,并提供网络信息服务。”

从“十一五”规划到“十二五”规划,对数字档案馆建设要求的力度显著加强,“十一五”规划中对数字档案馆建设只是点到为止,而“十二五”规划对数字档案馆的建设提出了详细而具体的要求,在措辞上从“推进数字档案馆建设”转变为“完成数字档案馆建设”。从2006年到2015年的10年间,数字档案馆建设成为我国档案信息化建设的重中之重。《纲要》在第三大部分“主要任务和实现指标”中提出持续推进数字档案馆建设,并给予了量化要求:“全国50%的县建成数字档案馆或启动数字档案馆建设项目;全国省级、地市级和县级国家综合档案馆馆藏永久档案数字化的比例,分别达到30%-60%、40%-75%和25%-50%。”而后,《纲要》紧接着提出了“采用大数据、智慧管理、智能楼宇管理等技术,提高档案馆业务信息化和档案信息资源深度开发与服务水平”。虽然《纲要》没有直接提及智慧档案馆,但大数据、智慧管理和智能楼宇管理等却是大数据和智慧城市视角下智慧档案馆的重要基础和技术支撑。

智慧档案或智慧档案馆的研究在档案界刚刚起步,却在国家档案局的政策性文件中正式提出,这是一个明显的信号,说明我国数字档案馆建设的边界需要延伸和拓展,大数据时代数字档案馆建设要向智慧档案馆建设转变。可以预见,智慧档案馆的研究和实践试点将是未来档案信息化建设的特色内容。国家层面从建设数字档案馆到构建智慧档案馆的理念突破,给那些理念滞后、有技术畏难情绪或者叫嚣技术无用论的机构、单位和个人一声棒喝,同时也是一种警醒。

(二)扩展泛化电子文件管理视阈,关注行业电子文件管理发展

电子文件管理无论从学术角度还是从实践角度都是近20年来国际国内档案界的热点。因此,在档案事业发展的“十五”“十一五”和“十二五”规划中,电子文件归档一直都是重点内容。然而,这三个规划均是泛谈电子文件,或者强调公文电子文件和CAD电子文件。如“十五”规划提出“研究制定电子文件归档和电子档案管理的制度与办法,积极推广国家标准《CAD电子文件光盘存储、归档与档案管理要求》,试点接收电子档案进馆”。“十一五”规划提出:“规范电子文件归档、管理与接收工作,建立健全电子档案接收机制和相关规章制度。利用电子政务网络平台进行政府公开信息的网上数据传输、采集和档案。”“十二五”规划中将电子文件管理与数字档案馆建设并提,特别提出要“配备和开发档案数据库管理系统、电子文件归档管理系统、电子档案移交管理系统、数字档案信息利用系统等”。综观这三个规划,基本上都对电子文件采取了泛化的描述方法。

反观《纲要》,其在任务中提出“加强对业务系统电子文件归档管理,通过推进电子会计档案管理促进电子政务和电子商务文件归档管理工作;制订和完善信用、交通、医疗等相关领域的电子数据归档和电子档案管理的标准和规范”。《纲要》首次具体提出了电子会计档案、电子商务文件,信用、交通、医疗等领域的电子数据和档案管理,其亲民性和实用性的转向路径让人耳目一新。

我国电子文件管理研究的20年间,科研成果不可谓不丰硕,但是关于理论与实践脱节的呼声一直不绝于耳。除了科研论文饱受诟病之外,科研项目中具体商务、交通、医疗等领域的电子文件管理研究也不多。但这些业务领域的电子文件管理实践却并没有因此停滞,尽管它们并没有一致使用“电子文件”这个术语。国家层面还出台了针对这些领域的规范标准,如2004年8月,2005年4月施行的《中华人民共和国电子签名法》针对(商务)“数据电文”电子签名的法律效力和认证办法作了规定,被认为是中国首部真正电子商务法意义上的立法。该法将数据电文定义为:“本法所称数据电文,是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。”关于数据电文与电子文件的概念辨析,在该法出台后档案学界已有一轮学术上的回应与探讨,本文不再赘述,但也仅限于学术探讨,档案部门并没有积极参与实践,一些学者甚至认为电子商务方面的法规与档案界无关。

随着大数据时代的到来,数据的行业边界越来越模糊,大数据学家舍恩伯格认为大数据时代涉猎大数据的机构或者个人分为掌控数据者、掌握或提供技术者以及拥有大数据思维者三种类型,其中掌控数据者是大数据价值链的核心部分。[1]那么,档案部门在大数据时代若想进入数据掌控者的行列,就不能墨守成规,应突破原有电子文件管理研究视阈,敏锐地认识到存在于各行各业业务系统中数据的价值,参与对这些数据的采集与管理,实现大数据时代电子文件与档案数据管理的跨越式发展。

(三)走出电子档案双套双轨制困境,试点单套单轨制

关于电子档案的保存模式,从2002年起,国家档案局、国务院办公厅等部门就了多项法规标准,这些法规和标准一致指向双套制归档和双轨制运行模式,在电子档案管理初期,双套制模式成为电子档案管理的法定模式,这也是由当时的理研究基础和技术条件决定的。然而,随着技术的不断更新,电子文件的类型和运行环境越来越复杂,双套制管理模式的弊端也越来越明显,导致档案理论界对这一制度频频质疑。有学者提出实施双套制是一种“被异化的谨慎”,[2]还有学者认为双套制电子档案管理可能导致“资源浪费、某些文件类型无法双套制、文件流失、凭证性混乱”等问题。[3]理论界和实践部门的专家也普遍认为在社会信息化程度较高的环境中坚持“双套制”,会降低工作效率,违背利用信息化提高工作效率的初衷。[4]

这些质疑终于在《纲要》中有了回应,《纲要》提出“在有条件的部门开展电子档案单套制(即电子设备生成的档案仅以电子方式保存)、单轨制(即不再生成纸质档案)管理试点”。这种回应还缘于大数据环境下,电子文件归档数量和范围不断扩大,海量的数据信息尤其是非结构化和半结构化数据需要大量的存储空间和管理成本,这些非结构化和半结构化数据又难以纸质或缩微化,双套制实施在大数据时代面临更大困境。因此,单套单轨制既是解决传统双套双轨制问题的出路,也是大数据环境下电子档案管理模式变迁的必然选择。

当然,我们在诟病双套双轨制困境的同时,不能忽视单套单轨制也存在诸多风险。因此,《纲要》仍然保留“数字档案资源异地异质备份”的提法,这和有条件的部门试点单套单轨制并不矛盾。但是单套单轨制试点工作的开展却留给理论界和实践部门很多思考的课题。比如,满足哪些条件可以试点?哪些类型的电子档案适合进行试点?如何开展试点工作?有无法规标准的保障等等。

(四)超越小数据管理定势,探索与大数据行动的融合

小数据有狭义概念与广义概念之分,狭义概念是美国康奈尔大学的Deborah Estrin提出的“在线个体数据”,即以个人为中心的数据;[5]广义概念是我国徐立军为代表提出的与大数据相对的概念,即“在信息和数据不完整的情况下,通过科学抽样和技术调整,为个体或某类具体问题提供数据参考的数据包”。[6]档案界所约定的小数据与大数据是一对互为映射的概念,档案小数据不指向“个人数据”,而是与档案大数据互补,即在大数据概念出现前的非海量、结构化的传统档案数据。

《纲要》提出“探索电子档案与大数据行动的融合;研究制定重要网页资源的采集和社交媒体文件的归档管理办法”。大数据研究在我国兴起不到5年时间,档案界尚有学者对网页资源、社交媒体文件等和大数据密切相关的新研究领域是否有档案学研究价值,对他们的归档保存是否是档案部门的职责等问题还存在争议。在这种情形下,《纲要》将这些新概念纳入其中,表明了大数据时代国家档案部门将大数据与档案信息化建设深度融合的决心,其意义不言自明:大数据时代,档案数据概念的内涵和外延都发生了变化,既包括传统小数据管理状态下的电子文件与数字档案资源,也包括网络环境下重要的网页资源和社交媒体文件资源。因此,大数据时代,我们的话语体系和研究视野不再局限于文件、档案或者信息等概念,而要超越小数据时代的思维定势,积极探索档案信息化与大数据行动的融合,以满足大数据时代档案大数据与小数据管理协同发展的要求。

(五)突破档案信息公开藩篱,走向档案数据开放

在中国知网全库中以篇名为“档案信息公开”或“档案信息开放”检索,可搜出期刊论文84篇,其中最早的一篇是1998年吴海亭发表在《北京档案》的《档案信息公开与商业秘密保护》;在“档案学与档案事业”子库中检索篇名为“信息公开”或“信息开放”的论文有426篇,其中篇名中含有“政府信息开放”或者“政府信息公开”的论文有271篇。检索结果至少可以说明两个问题:第一,信息公开或者信息开放研究是档案学界近20年的一个重要研究领域;第二,政府信息公开和政府信息开放是档案学人在信息公开或信息开放领域的主要研究对象。

然而,在中国知网全库中以“档案数据开放”或“档案数据公开”为篇名检索论文为0篇,但以“数据开放”“数据公开”或者“开放数据”为篇名检索出280篇(时间跨度为2001-2016年),而且近5年论文数量呈急速上升的趋势;在中国知网的“档案学与档案事业”子库中以“数据开放”或“数据公开”为篇名检索论文数量为0篇,以“开放数据”为篇名检索出论文只有2篇(2015年和2016年各1篇)。这个检索结果也至少说明了两个现象:一是数据开放的研究在其他学科领域已经进行了十余年,在大数据时代达到了高峰;二是档案学界仍然执念于信息与数据的关系,对于数据的提法不以为意,对于大数据时代从信息开放到数据开放的转型缺乏学术与职业敏感度。

《纲要》提出“建立开放档案信息资源社会化共享服务平台,制定档案数据开放计划,落实数据开放与维护的责任;优先推动与民生保障服务相关的档案数据开放”。在国内档案界数据公开或数据开放研究几乎处于空白状态的背景下,国家档案局超前于理论界,在《纲要》中提出档案数据开放的研究与实践,这是前所未有的,也是国家档案部门在万众创新的大数据时代背景下思维变革的一种体现。《纲要》对档案数据开放的提出也促使档案人加快适应大数据时代的创新节奏,认识到数据与信息的关系已然发生了变化,在其他行业领域数据开放和开放数据的理论研究与实践探索如火如荼的情势下,档案人应从档案信息公开的藩篱中走出来,积极参入档案数据开放的研究和实践。

三、结语

全国档案事业发展五年规划是我国档案事业发展的纲领性文件,对档案事业发展起到方向和引领的作用。《纲要》对于档案信息化建设的设计,突破与超越了前三个五年规划的框架,从大数据的视角,以开放、创新的理念勾画出2016―2020年档案信息化建设的前景和路径。《纲要》将智慧档案馆、行业电子文件数据管理、电子档案单套单轨制、网页资源采集归档、社交媒体文件归档、档案数据开放等最新、最前沿、与国家创新发展密切相关的研究课题作为档案信息化建设的主要任务提出,这是大数据时代档案信息化的C遇,更是挑战。档案人只有更新思维,积极谋划并参与这些前沿课题的研究与实践,才能推动档案信息化的发展,才能跟上国家信息化与社会信息化的发展步伐。

注释与参考文献:

[1] [英]维克托・迈尔―舍恩伯格.大数据时代―生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:160-178.

[2]苏君华.被异化的谨慎――对“双套制”管理的问题分析及策略[J].档案学通讯,2015(4):100-104.

[3]陶水龙,田雷.电子档案双套制管理问题研究[J].档案学研究,2014 (4):61-64.

[4]杨博文.档案信息化“十三五”发展研讨会议综述[J].档案时空,2016(2):27-29.

[5]孙红蕾,郑建明.小数据思维驱动下的数字文化治理路径探析[J].图书馆学研究,2015(18):39-42.

上一篇:开放式教学论文范文 下一篇:中药市场论文范文