资料监管论文:非书资料监管系统的剔旧诌议

时间:2022-07-11 03:05:11

资料监管论文:非书资料监管系统的剔旧诌议

作者:姚朋 徐宏儒 王卓 单位:承德石油高等专科学校

非书资料管理系统简介

基于浏览器/服务器结构的非书资料管理系统的硬件结构主要是一台万维网服务器,并连接有一台大容量的冗余磁盘阵列机,本馆的磁盘阵列的容量是1.6T。系统是以Web站点的形式部署在万维网服务器上,光盘数据存放在磁盘整列上。本馆的光盘记录是由工作人员通过浏览器从后台录入,同时把光盘上的数据加工成标准的ISO格式,上传至服务器,这样即完成了一张光盘的录入工作。用户通过浏览器访问系统首页,就可以检索并下载所需的光盘资料,下载的资料经解压后即可使用。同时系统还提供无记录上报、空链接上报、资料损坏上报、留言以及统计功能等,在方便读者索取资源的同时,也帮助改进网站的资源建设。

剔旧的必要性和可行性

以目前的经费使用状况,无法以扩充存储设备容量的方法来解决这个问题,因此剔旧是目前最可行的方法。但即使经费充足,盲目地扩充存储设备的容量也不是一个可取的方法,而应该是保持在一个合理的存储容量之内。根据承德石油高等专科学校图书馆以年代来划分的统计,2008年录入的数据中,至今被下载过的比率是37%、2009年的比率是65%、2010年的比率是51%。同时,根据统计,在2008年录入的TP类资料中,有620G的资料未被下载过,占光盘总存储量的43%。这些未被下载的资料在以后被下载的可能性很小,完全可以作为剔旧的对象。如果以后有用户索取已经被剔旧的资料,工作人员也可以重新加工、上传,由于这种情况的概率很小,因此不会对用户的使用以及系统维护人员的工作量造成很大的影响。由此可见,剔旧对非书资料管理系统的维护是一个必要的工作,而且也是完全可行的。

剔旧策略

剔旧策略中使用的参数共有4个:分别是录入日期、下载次数、最后下载日期、剔旧种类。①录入日期:对大部分资料来说,年代越久,可利用的价值就越小,因此录入年代最久的资料是首选的剔旧对象;②下载次数:某一资料的下载次数直接和客观地反映了这个资料对用户的价值,因此未被下载过的资料是要剔旧的对象;③最后下载日期:如果有些年代较久的资料近期还被下载过,说明它还有保留的价值,不应被删除;④剔旧种类:如果系统中存在某类光盘资料占用了较大的存储空间,并且这类资料被下载的比例不高,就可以仅选择这类资料作为剔旧的对象,否则就以所有光盘作为选择对象。比如在承德石油高等专科学校图书馆中,TP类的资料就是一个典型的例子。以上4个参数的合理组合和设置,就是一个完整的剔旧策略了。一般情况下,选择那些录入日期最早、下载次数为0的记录,就可以满足释放空间的需求了,这也是最理想的剔旧策略。当然,可以根据实际情况,具体的调整4个参数的设置,以达到最佳的剔旧效果。

剔旧策略的实现

为了简化程序的实现并与整个系统的结构保持一致,仍然用浏览器/服务器的结构来实现这个剔旧策略。但考虑到如果一次删除的数据较多的话,程序可能会在服务器端运行超时,因此可以设置每次删除的记录为10条。这样,使用2.0就可以非常容易的实现这个剔旧策略了,只需通过Web表单查询符合以上4个参数的记录,在数据库中相应的记录上做一个删除标志,然后删除相应的光盘文件就完成了。被剔旧记录上的删除标志可以告知用户和系统维护人员此资料已经被删除,如果需要,可以申请重做。

剔旧的频率

剔旧的频率是实施剔旧的时候值得考虑的一个问题。如果光盘资料的加工是缓慢且持续进行的,那么剔旧的频率就可以高一些,但是每次执行的剔旧数量比较少。比如说每周执行一次剔旧任务,甚至每天执行一次剔旧任务或者根据需要来随时剔旧。这样的好处是可以最大限度地延长资料在系统中保存的时间和提高存储空间的利用率。如果光盘资料的加工是在短时间内集中完成的,那么就适合一次性完成所需要的剔旧工作,释放较大的存储空间,为新增的光盘资料留出空间。对基于浏览器/服务器结构的非书资料管理系统,制定并实施合理的光盘资料剔旧策略,是解决在有限的存储空间下使光盘资料能够不断地更新,并将最有价值和最新的资料提供给用户的一个有效的和可行的方法。

上一篇:档案资料论文:档案资料管控中的保密工作透析 下一篇:电视声像论文:完善电视声像资料管制的思索