一种基于自主计算的数字图书馆个性化服务隐私保护框架

时间:2022-07-26 11:28:05

一种基于自主计算的数字图书馆个性化服务隐私保护框架

[摘要]分析数字图书馆个性化服务各个环节中存在的隐私泄露方式,提出一个基于自主计算的数字图书馆个性化服务隐私保护框架,对用户隐私泄露的各个环节采取系统的保护措施。该框架具有自主计算的自我配置、自我优化、自我修复和自我保护的特性,减轻对容纳多种隐私保护技术的系统的配置复杂性,在多变的复杂环境中具有自适应的特性。

[关键词]自主计算 隐私保护 数字图书馆

[分类号]G250.76

1

数字图书馆个性化服务是基于信息用户的信息使用行为、习惯、偏好、特点及用户特定的需求,向用户提供满足其个性化需求的信息内容和系统功能的一种服务,其方式包括个性化的内容定制、个性化页面定制、个性化信息推送、个性化检索定制等等。然而,用户在享受个性化服务的同时,存在个人隐私被泄露的风险。事实上,隐私保护已成为个性化信息服务亟待解决的重要问题。

目前对个性化服务隐私保护的研究主要集中在两个方面:一是对个性化服务隐私保护的法律、法规方面的研究;二是研究个性化服务隐私保护的信息技术,包括用户信息的表示与识别技术、通信隐私以及安全存取技术等。后者主要从个性化服务的某个方面进行隐私保护研究,缺乏针对数字图书馆个性化服务隐私保护的整体模型研究。本文提出一个基于自主计算的数字图书馆个性化服务隐私保护框架,在框架上实施全面的隐私保护关键技术;同时,通过引入自主计算特性,使系统具有自我配置、自我优化、自我恢复、自我保护的自主计算特点,能够在个性化服务的各个环节为用户隐私提供全面的和自适应的安全保护机制。

2 数字图书馆个性化服务隐私保护技术

数字图书馆在提供个性化服务时,难免涉及用户的隐私。隐私是与个人相关的不允许被他人非法搜集、知悉、利用和公开的信息资料集合,这些信息只能按照所有者的意愿在特定时间、以特定方式、在特定程度上被公开。个人隐私中包含有价值的信息,如果这些信息被他人获得,可能会造成个人的名誉、精神或者经济方面的巨大损失。因此,需要对数字图书馆个性化服务中可能造成隐私泄露的环节进行详细分析,并针对这些环节实施相应的隐私保护技术。

2.1数字图书馆个性化服务中的隐私泄露

数字图书馆个性化服务的多个环节都存在泄露隐私的风险,主要体现在对用户个人信息的搜集建模、传输使用和存取三个方面。

2.1.1

用户信息搜集建模时的隐私泄露 数字图书馆个性化服务主要表现为两个层次:一是按用户要求进行信息订制;二是挖掘用户兴趣模式,为其主动提供需要的服务。建立准确的用户信息模型是实现这两个层次的个性化服务的关键。在用户模型建立与更新的过程中,首先需要从各个方面来收集用户的信息。

用户信息主要包括三个方面:①用户基本信息,主要是用户在首次访问数字图书馆服务时输入的姓名、性别、年龄等信息,这些信息主要用来识别用户的身份;②用户的反馈信息,由于用户的兴趣爱好并不是一成不变的,个性化服务系统一般都设置了反馈机制,让用户对检索结果和推荐的文档进行评价,然后根据这些反馈评价信息可以不断更新用户兴趣模型;③用户访问历史信息,服务器日志中纪录了用户的IP地址,访问时间、检索内容和访问结果,个性化服务系统运用数据挖掘技术对Web服务器日志和Cookie等网络使用记录进行分析和挖掘,实现对用户的信息需求和潜在需求的动态跟踪、分析、预测。

数字图书馆个性化服务系统在隐式获取用户兴趣信息、建立和更新用户兴趣模型的时候,往往在不为用户知晓的情况下进行,使用户的隐私权遭到侵害。用户对自身的描述文件无法进行控制和修改,导致个人隐私泄露的可能。如果这些客户信息被非法披露或利用,就可能对客户造成危害。

2.1.2用户信息存取时的隐私泄露 用户信息模型建立起来后,在进行个性化服务的过程中,需要频繁地对这些数据进行存取访问,一些不法分子会对这些数据进行未经授权的访问获取,这些访问有可能来自于外部绕过安全机制的攻击,也有可能来自于内部疏于管理的漏洞。例如,存放在本地计算机的用户文件被黑客窃取、用户的操作被木马记录并传递给木马控制者、网络管理员违规查看数据库记录等。这一类型的隐私泄露源于计算机安全措施的缺乏,没有采取足够的主动保护本机或服务器数据存取安全的手段,从而导致大量的安全漏洞,不仅造成用户隐私数据的泄露,还可能造成用户信息被篡改。

2.1.3

用户信息在网络上传输时的隐私泄露

数字图书馆在实施个性化服务中,首先需要进行个人信息搜集,并构建成用户信息描述文件数据存放起来。当用户请求服务时,包含个人隐私的用户描述信息与检索请求在网络上进行传输,用户隐私数据可能会被一些不法分子采用嗅探器等技术进行非法截获,从而造成隐私泄露。由于网络传输的公开性,无法阻止他人获得这些数据,但是可以通过加密手段避免传输明文数据等安全手段,防止他人获得传输数据后重组成有意义的数据。

2.2数字图书馆个性化服务中的隐私保护关键技术

从上述分析可以看出,需要从用户个人信息的搜集建模、传输使用和存取三个环节上实施全面的隐私保护,具体技术描述如下:

・用户信息模型建立的隐私保护技术。数字图书馆个性化服务可以使用P3P(Platform for Privacy Prefer-ence)标准和EPAL(Enterprise Privacy Authorization Lan―guage)语言来实现与用户进行隐私保护协商功能,这些标准对系统如何搜集用户信息、搜集用户的信息类型、对用户信息的使用目的进行了定义,用户可以自主地选择适合自己的隐私保护参数。为了防止非法使用数据挖掘技术来获取客户的隐私信息,可以采用k匿名、1多样等技术达到保护记录所有者隐私的目的。

・用户信息访问隐私保护技术。用户信息模型建立起来后,形成用户描述文件并存放起来。数字图书馆需对用户信息提供安全的存储和读取技术,使用户隐私数据不受木马、黑客等安全威胁。可以采用访问控制技术、入侵检测技术、审计技术来保障数据的安全访问。

・用户信息通讯隐私保护技术。为了保护用户的隐私数据不被非法地截获利用,需要采用安全的通讯技术。数字图书馆可以采用虚拟专用网(Viaual Pri―vate Network)技术实现用户隐私数据在网络上的安全传输,还可以将待传输的用户数据进行加密,来保障数据的安全性。加密算法主要有对称与非对称两类,目前加密算法己经具备相当高的安全性。

3 数字图书馆个性化服务隐私保护框架

3.1框架的提出

数字图书馆个性化服务隐私保护框架由三个基于自主计算的自主元素(AE)组成,在使用一个智能用户接口来提供对用户的信息引导和个性化服务的同时,实现各个层面的用户隐私保护功能,如图1所示:

・用户界面AE负责与用户交互,向用户提供查询等服务,它主要由输入接口、历史库、推理机、用户模型库和输出接口构成。用户界面AE通过输入接口不断地将用户的使用情况记录下来,存放在历史库中,推理机根据历史库中用户的使用记录,运用知识库,配合用户模型,分析推理出当前状态下用户的意向,主动或半主动地帮助用户使用。同时,推理机还根据用户新的使用情况不断更新优化用户模型,推理机利用知识库中关键词的分类信息,使其查询进一步细化。在用户隐私保护方面,用户界面AE主要包含实施隐私保护机制的用户描述文件创建技术,包含安全的用户信息搜集与挖掘技术和用户可控的兴趣模型建立技术,根据不同用户对隐私的敏感程度,自行对个人隐私搜集建模进行不同程度的控制,建立可裁剪的用户个人描述文件,以满足用户在信息搜集建模上的个性化需求。

・用户模型访问AE提供对用户模型信息的访问功能,通过集成对用户信息进行安全的存储和读取技术,包含访问控制技术、入侵检测技术、审计技术等,使存储的用户信息不受木马、黑客等安全威胁。

・信息检索AE根据用户的兴趣模型,主动地从本地的数字资源和网络资源上搜索用户需要的信息,实现对所收集信息进行相关性分析和信息过滤。用户界面AE与信息检索AE都需要访问用户模型信息,因此它们都集成了网络安全通讯技术,包括数据加密、VPN、安全传输技术等,保证用户数据在网络通讯中的安全。

为了保障用户隐私的安全,一个完整的数字图书馆个性化服务隐私保护框架需要容纳用户个人信息的搜集建模、网络传输和信息存取等一系列安全技术,因而配置管理这些安全技术的任务是繁琐而复杂的,通过为隐私保护框架引入自主计算的特性,使系统在最佳状态下自主地运行,根据系统状态变化及其造成的系统运行预期变化进行统计分析,实现自我配置、自我优化、自我恢复与自我保护,降低系统配置管理的复杂度。

3.2自主元素的工作原理

如图2所示,自主元素由监视部件、分析部件、规划部件、执行部件和知识库部件组成,形成了MAPE(监视-分析-规划-执行)控制环,这4个功能部件均在知识库的支持下运行。监视和分析部件提供自我觉察和外部环境觉察的能力,并以此为基础进行自主决策,确定系统的自适应目标;规划和执行部件实现系统状态偏离期望目标时的自适应功能,通过模型中不间断状态变迁信息传递来实现自主元素的自我保护和自我治愈。由于知识库具有所有主体运行的状态,尤其具有运行期望所对应的主体的期望状态,一旦传送的状态变迁有异常,则可以立刻发现并采取相应的保护策略。

自主计算系统由若干相互联系的自主元素组成。在知识库的策略的指导下,自主元素通过系统感知、状态分析、策略决策和策略应用四个步骤实现局部的自主管理通过交互和协作实现整个系统的全局自主管理。

在基于自主计算的数字图书馆个性化服务隐私保护框架中,通过用户界面AE、用户模型访问AE和信息检索AE三个自主元素的局部自治与它们之间的交互协调,实现对个性化用户模型建立、用户模型的安全访问以及用户信息的安全传输三个方面的系统自适应式的用户隐私安全保护。

4 结论

个性化系统本身的复杂行、动态性、分散性使得用户隐私保护面临越来越多的挑战。本文研究了数字图书馆在开展个性化服务的过程中的用户隐私泄露途径,提出了一个基于自主计算的用户隐私保护系统框架,从技术上提出了用户隐私数据保护的解决方案,框架具有自主计算的自我配置、自我优化、自我修复和自我保护的特性,减轻了对容纳多种隐私保护技术的系统的配置复杂性。当然,对用户隐私的保护不能仅仅依靠技术来解决,政府也需加强立法,从法律上对用户隐私权进行保护。数字图书馆也应该建立健全隐私保护制度,并加强对用户的教育,提高用户的自我保护意识。

上一篇:基于读者行为特征的数据库购买决策研究 下一篇:面向服务细分的公共图书馆用户结构研究