自媒体网络信息归档初探

时间:2022-09-22 06:19:24

自媒体网络信息归档初探

1自媒体网络信息的档案属性

自媒体网络信息可分为原创和转载两种类型,本文主要讨论的是原创类自媒体信息的档案属性。

1.1原始记录性

人们在工作、学习、旅游、休闲等活动中因有感或有诉求而通过自媒体信息、状态,例如微博或QQ空间、微信朋友圈等,人们在自媒体上的信息都蕴含着作者的思想,反映了一个时代人们交流方式的嬗变。这种交流平台的简易、便捷和有效吸引了越来越多的用户使用自媒体,并通过这种平台随时随地与别人分享自己的近况或者曝光一些社会的隐秘面,这类原创信息始终是自媒体平台信息的主体,也是自媒体能够经久不衰的原因所在。以微博为例,公众人物利用微博建立自己的网上形象,并利用微博宣传自己;企业利用微博进行形象宣传、媒体公关与产品营销;政府部门使用微博政务信息,引导社会舆论,维护社会稳定……各个社会单位为塑造自身的良好形象,在使用微博信息时会非常注重信息的原创性与真实性。

1.2社会记忆属性

个人通过自媒体的信息内容一般是个人在其日常生活中,有感而发的一些心情描述或生活记录“,个人置身于群体的框架中进行回忆,而群体的记忆却是通过个体记忆来传达与实现的”。这些“琐碎”的记忆单个看起来也许价值不大,但从整体来看,无数条这样的个人微博组织在一起,就成为能够反映社会各方面情况的群体记忆。而政府或某些社会团体的信息,则反映了社会各个领域的生产与管理活动情况,这些内容同样具有社会记忆属性,将这些信息保存起来,可作为未来某个时候考察与复原当代人们生活面貌的重要依据。以博客来讲“,个人记忆被强烈呼唤,博客从技术上满足了这种需要,是对私人或者是人民记忆的最好实践。作为记录的博客的存在,被评价为‘私人领域浮现出公共空间’、‘平凡人物群体亮相’,博客虽然是个人写作,但是对个体的关注与时代风云密切相关,不仅如此,这无数双眼睛补充着被时代忽略的记忆”。从这方面的功能上来说,但凡自媒体平台,大体与之类似。无数的个体的记忆汇聚在一起,能够更加全面细致地反映当代社会生产生活的原始面貌。把有价值的自媒体网络信息加以归档保存,使其发挥社会记忆功能,对人类社会、历史的研究与发展将是一种贡献。

2自媒体网络信息归档的障碍

2.1自媒体网络信息的海量性、碎片化

根据中国互联网络信息中心(CNNIC)最新的第36次《中国互联网络发展状况统计报告》显示,截至2015年6月,我国微博客用户规模为2.04亿,网民使用率为30.6%,手机端微博客用户数为1.62亿,使用率为27.3%。另外,据2015微信用户数据报告,截至2015年第一季度末,微信每月活跃用户已达到5.49亿,用户覆盖200多个国家、超过20种语言,各品牌的微信公众账号总数已经超过800万个。从这些数据中我们可以看出,微博客、微信等自媒体的使用范围极其广泛,因而其信息生产迅速而分散,且数量巨大,这对归档信息的收集和保存造成了障碍。

2.2自媒体网络信息制作的随意性、内容的真实性问题

与传统媒体相比,自媒体的信息制作主体发生了变化,由大众传媒的专业机构扩大到没有经过新闻采编训练的普通大众个体,自媒体世界中的每个人既是信息的受众也同时是信息制作者。由于信息制作主体的广泛性、素养层次不一,其所的信息带有极强的个人色彩,随意性比较强。一方面,在现实社会中,一部分价值观、理想信念扭曲的小众对自媒体网络的滥用,使自媒体成为制造传播虚假信息的高效平台。部分用户为追求关注度,提高点击率,越过自身道德底线,肆意道听途说或自我编造的虚假信息,给自媒体网络造成了信息污染。另一方面,“Web2.0时代,数字技术的进步引发了传播领域的变革,其本质便是传播主题的泛众化。传统媒介组织在信息端口把关的模式发生改变。网民个体可以不经媒介组织,直接在网络平台上信息”。这意味着针对自媒体信息的把关及管控的缺失或不力,使得任何个体通过自媒体信息处于一种放任的状态,而现有的法律或规定偏向于追责,无法从源头解决自媒体网络信息的真实性问题。

2.3自媒体网络信息安全问题

自媒体网络信息安全主要涉及两个方面的问题,一是自媒体网络中不良的、有攻击性的信息会对人们产生伤害,二是各种原因造成的自媒体网络信息删除或丢失。在互联网中,网民素质参差不齐,如果网民通过自媒体传播一些不良信息,对他人进行谩骂、构陷、攻击,相关的审查手段是没有的,自媒体信息更新量大且迅速,即使有信息筛选或审查机制,也难以在其产生不良社会影响前得到根除,事后服务运营商或政府主管部门责令其将有害信息删除或对主体进行封号。但对于一些产生过较大社会影响的信息,虽然是虚假或有害的,但也有保存的需要,将这些信息及相关评论、转发记录与相关后果总结一并归档,能够便于后人了解这一事件的来龙去脉,从而能够更加详实地对我们这个时代的社会状况进行了解与研究。另外,目前自媒体信息暂存于运营商的数据库中,它依赖于运营商的正常运行,随着历史的发展,事物都是在变化的;另外,地震、火灾、恐怖袭击等不确定因素也是自媒体网络信息及用户数据保存的潜在威胁。例如美国“911”恐怖袭击中,众多大公司因其部分重要档案、资料、数据被毁,从此一蹶不振,而事先做好异地备份的公司则没有在那次袭击中受到太大影响。目前我们对自媒体网络信息的归档留存工作认识不足,工作力度太过薄弱,有必要将其作为研究对象,加以讨论研究并付诸实践。

3自媒体网络信息归档的关键要素分析

3.1自媒体网络信息归档责任主体分析

在国外,对网络信息保存问题给予关注的主要是图书馆,有10多个国家启动了国家级的网络信息保存项目,大多以图书馆作为责任主体,我国由国家图书馆承担的WICP项目(网络信息资源采集与保存实验项目)启动于2003年。受图书馆职能定位的影响,由图书馆主导的网络信息保存对象主要是数字出版物以及Web网页等信息,而美国国家图书馆曾做过微博客信息内容的采集与出版。由此可见,针对网络信息的保存工作目前仍处于浅层阶段,尤其是针对自媒体网络信息的归档保存,始终没有一个部门来主导和负责。自媒体网络信息内容丰富,数量庞大,从档案工作的视角来看,将各政府机构、社会组织及个人在自媒体中的具有一定价值的原始记录性信息进行采集与归档保存,能够有力地反映和辅助再现社会各项活动的原貌,发挥与传统纸质档案同样的参考与凭证作用。赵展春认为,网络信息资源的归档保存既是档案部门在网络时代工作职能延伸的必然要求,又是适应网络时代进一步发挥档案价值功能的必然选择,网络信息资源归档保存强调网络信息资源的档案化处理过程,与图书馆在工作内容和目标上有所区别,因此必然要求档案馆成为网络信息资源归档保存的活动主体。自媒体网络信息是整个网络信息海洋中的一部分“,档案工作者是建构社会和历史记忆的积极因素。在此过程中,他们不仅有义务保护或记录过去,还有责任把未来的需要和期望铭记于心”。因此,自媒体网络信息的归档保存工作自然而然地应由档案馆来主导。然而,自媒体网络信息的归档工作量大、复杂、技术要求高,仅凭档案馆一方的力量难以完成,档案馆需要寻求运营商和第三方的技术、资金、人才支持,才有可能将这项创新性工作持续推进。比如与运营商合作共同开发智能应用工具,自动筛选有价值的自媒体网络信息并保存到本地;也可以招募民间志愿者,比如新浪微博中的“江宁公安在线”、“谣言档案馆”等用户,他们经常会总结制作一些对社会和人们产生影响的传谣事件信息在其个人微博上,也帮助网友鉴定一些自媒体信息的真实性,这对减轻谣言对人们的影响,扼止虚假信息的继续扩散有积极的作用。

3.2自媒体网络信息采集方式、技术分析

以微博为例,国外应用最广泛的微博客Twitter网站推出了一款微博归档工具,这款工具备受用户青睐,它的主要功能就是允许用户将他们过的所有微博即他们的全部Twitter消息都下载下来,保存在本地。用户利用这项功能可以下载的内容包括用户的微博和评论,可按月分期下载,或通过关键字、特定短语、标签和用户名进行搜索,以有选择地进行下载。其他一些公司如谷歌(微博)和Facebook早就已经向它们的用户提供了下载数据的功能。Twitter推出这项功能比其他公司要晚一些,它鼓励那些活跃的Twitter用户回复旧微博,并且给那些微博打上#TwitterArchive的标签,这样旧微博就可以再次被其他人看到。在我国,自媒体服务运营商尚未推出类似的归档工具,只是一些民间爱好者自行制作出了类似的但功能较为简单的信息备份工具,这种备份工具能够使用户将自己的信息下载保存为TXT格式。档案工作者对自媒体信息的采集工作所面临的困难显而易见。然而方法还是有的:第一种方法是截屏,这是最简单但也是最没有效率的方法;第二种方法是先由自媒体用户自己下载备份自己所的信息,档案馆再有针对性地进行征集,这样做的好处是避免了用户与档案馆之间信息使用权的纠纷,但这种方法的效率也是很难保证的;第三种方法是利用先进的网络信息采集技术,实现自媒体网络信息的智能化、成批量的抓取;第四种方法是寻求服务运营商支持,直接从其数据库中获取有效的自媒体网络信息。第三、四种方法看起来要高效许多,但这两种方法的施行必然会面临许多法律上的问题,也会加大信息鉴定的工作量。因此,要做好信息采集工作,首先要处理好档案馆、用户、运营商三方的关系,这是工作开展的前提。

3.3自媒体网络信息归档的鉴定、描述与组织

为了保证所归档保存的自媒体网络信息具有一定价值,在归档前需要对所采集到的信息进行鉴定与筛选。鉴定工作主要包括两个方面,一是对自媒体网络信息价值的鉴定,二是对其真实性的鉴定。首先要保证所归档的自媒体网络信息是有价值的,例如当事人对社会、自然重大突发事件第一时间的亲历性报道,社会热点话题,名人随笔,涉及某一案件的相关文字、照片、视频或者某项重大活动中重要人物的出席照片、视频、言论等,这些信息在未来具有可预见的参考、凭证作用。另外要对所采集到的信息的真实性加以求证,如果信息是虚假的,在归档时应标注清楚,并列明事实。归档信息的描述与组织是其能够被检索利用的前提。要做好自媒体网络信息归档的描述与组织工作,首先要有一定的著录标准,目前在这一方面还有所欠缺。在技术上可行的一种方法是采用元数据格式对自媒体网络信息资源进行描述与组织,那么,我们所要解决就是元数据的采集或制作问题。都柏林核心元数据是由计算机专家、网络专家和图书馆专家等人员所组成的一个非正式小组于1995年在美国俄亥俄州都柏林开发的元数据元素集。它由3个核心元数据集(内容属性、知识产权属性、形式属性)与15个元素(包括标题、创作者、主题、摘要等)构成。都柏林核心元数据简单易用,并主要用于网络资源的著录和发现,为网络信息资源的检索利用提供了很大便利。构架与创建规范化的元数据,要按照一定标准,从自媒体网络信息中抽取出相应的特征,设计一套规范的元数据格式,以实现对信息的规范化描述。目前在不同领域和不同应用项目中已存在多种不同的元数据格式,针对自媒体网络信息,我们应综合多方面因素,设计一套最为合适的元数据框架,这个框架应把主题、来源、语种、创建者、日期、类型等元素包含进去。

3.4自媒体网络信息归档法规制度建设

自媒体的使用群体范围特别广泛,因此自媒体网络信息的归档工作会涉及到许多层面的人和事,这项工作的顺利开展需要社会各方面的支持与配合,尤其需要国家层面对自媒体网络秩序加以约束和规范,制订相关的法规制度。目前来看,已有一些相关的规定或制度得以实施,比如新浪微博推出的名人、网站、媒体、高校、企业以及身份通认证,微信的公众号认证、账户绑定手机号等。另外北京市2011年12月推出《北京市微博客发展管理若干规定》,实行“后台实名,前台自愿”的原则,此规定实施后新注册微博用户在注册时必须提供真实身份信息,但用户昵称能够自由设定;未进行实名认证的微博老用户,将不能发言、转发,只能浏览。这些规定的施行有助于追溯相关信息的原始制作人,以督促用户对其所的信息负责,减少虚假、有害信息的与传播。有关规定对自媒体网络秩序有规范作用,有助于加强信息采集的针对性,为信息归档工作创造方便。然而对于档案馆开展自媒体网络信息归档工作来说,最有力的支持是从法律层面上赋予档案馆这方面的权利和义务,这样才能减少信息采集与归档工作的阻力与难度。

4结语

自媒体赋予并扩大了社会个体及非媒体组织以往所缺乏的话语权,吸引了学者、名人等社会各界人士,政府机构、社会团体等各类组织参与其中,这使得自媒体的管理与运作必将逐步向规范化的方向发展,在自媒体网络平台中生成的信息也将随之规范化而更具有保存价值。在当今自媒体用户数量巨大且仍在增长,以及自媒体硬件平台由PC端转至移动端的情况下,自媒体网络信息归档面临着严峻的形势,档案馆理当审时度势,对自媒体网络信息归档进行探索与实践,这是考验档案馆魄力的时候,也是壮大档案事业的机遇。

作者:任洪展 单位:上海大学图书情报档案系

上一篇:通信技术中高职课程体系研究 下一篇:民航空管计算机网络信息探讨