全文检索范文

时间:2023-10-13 16:06:37

全文检索篇1

[关键词]数据库 全文检索 存储加密

目前,计算机系统中数据存储的安全问题越来越引起人们的重视。传统的物理安全、操作系统安全机制和数据库访问控制机制为数据库提供了一定的安全保障,但这些并不能满足全部的安全需求,无法保证一些部门重要数据和敏感数据的安全。

一、安全需求

全文检索功能实现的一个必要条件是建立全文索引库。尽管全文索引也是基于一记录的某个属性建立,但与传统的数据库索引相比,全文索引给数据库系统带来了新的安全问题。传统数据库索引建立在比较容易标识的属性上比如编号,日期等,索引文件是简单的属性值与其存储的位置信息的对应关系而全文索引的优势体现在对长字段的查询上,索引一般建立在信息量较大的属性上,攻击者如果窃取全文索引库后,很可能会通过统计分析得到源文本的一些信息,给整个系统带来安全隐患,因此全文索引库的安全是一个值得关注的问题。

传统的数据库安全技术为全文索引提供了第一层安全保障。目前数据库安全技术主要有身份认证、访问控制、信息流控制、推理控制、审计和加密等。对于数据库中存储的高度敏感机密性数据,如财务数据、军事数据、国家机密等,除以上安全性措施外,一般还要采取对数据实施加密,数据加密是防止数据在存储和传输中失密的有效手段。

加密的基本思想是根据一定的算法将原始数据变换为不可直接识别的格式密文,从而使得非法用户无法获知明文的内容。加密和解密的方法分为两类对称密钥和公开密钥。公开密钥在20世纪70年代才开始出现,一般应用于数字签名中而古典的加密体制以及最近的数据加密标准DES和AES都是基于对称密钥的。

针对全文索引带来的安全问题,本文提出的解决方案是对全文索引库进行存储加密,加密后存储的全文索引有效地防止了信息泄漏。

二、存储安全技术

存储安全技术主要是针对数据库来说的,本文的全文索引库存储安全也属于数据库存储安全的范畴。数据库存储安全一般是通过采取基于密码的数据存储加密和完整性认证来保证。加密是确保数据安全的一个重要因素,也是目前数据库安全技术领域的一个重要研究发展方向。通常所说的数据库加密包括对静态存储在存储介质上的数据库数据的存储加密和在网络信道上传输的数据库数据的传输加密。

数据库存储加密按照对数据的加密范围一般分为整库加密和选择性数据加密两种方式,其中后一种方式又分为记录加密、字段加密和数据元素加密等方式。

(一)整库加密

数据加密是指对数据库数据文件中的所有数据进行加密。整库加密通常是数据库内核在将内存缓冲区中的数据写入存储介质之前进行加密,一般实现在数据库管理系统的存储管理层。采用这种方式的优点一是安全强度较高,二是存储加密机制对数据库内核的其它功能层完全透明,其缺点是在密钥应用不合理的情况下容易遭受密文攻击的威胁。因此整库加密方式通常采用子密钥的概念来实施,所谓子密钥,就是在整库加密方式下对数据库存储的数据进行分块,然后对不同的数据库块采用不同的子密钥进行加密。

(二)选择性数据加密

选择性数据加密是指有选择性地对某些记录、字段和数据元素进行存储加密。记录加密是把数据库表中的一条记录作为一个加密单元来进行加密。在这种方式下,为了防止合法用户通过对密文记录与明文记录进行比较的方式破解加密记录,原则上应做到一条记录一个密钥。如果数据库中需要加密的记录数比较少,可以考虑采用记录加密的方式。字段加密是把数据库表中的列作为一个加密单元来进行加密。与记录加密类似,为了防止密文攻击,原则上应做到一个字段一个密钥。通常在一个数据库表中,字段的个数小于记录的条数,因此,字段加密与记录加密相比,所需的密钥数量相对要少一些。如果只有少数字段需要加密,字段加密是一种较为可行的方式。

三、全文检索数据库的存储加密机制

存储加密密钥采用系统主密钥和数据块子密钥两级加密密钥,两级加密密钥均由随机数发生器生成。其中系统主密钥用于加密数据块子密钥,数据块子密钥用于加密实际的索引数据块。对于所有的索引库数据文件,数据块大小均划分为每块4KB字节大小。

为了确保存储加密的安全性,主密钥通过专门的密钥存储介质如软盘、盘、卡进行存储,应用系统在访问索引数据之前加载到数据库系统。所有的数据块子密钥由一个专门的子密钥文件进行存储,鉴于所有数据块子密钥是由系统主密钥进行了存储加密保护的,因此,子密钥文件可存储于主机硬盘之上。

随着数据库数据的动态增加,当需要创建新的全文索引数据块时,系统将从随机数发生器采集一个新的随机数作为该数据块的加密子密钥,并使用该加密子密钥对数据块实施加密后存放于索引数据文件中,然后再使用主密钥对该加密子密钥实施加密后存放于子密钥文件中。

本文中索引加解密主要思想是在数据物理存取之前进行加解密操作。也就说,DBMS在将内存中的数据写到外存如磁盘、磁带等时,进行加密操作,而将外存中的数据读到内存时,进行相应的解密操作。因为数据在内存中是明文的,DBMS的功能不会受到任何影响。

在对数据加密时,一个至关重要的问题是密钥的管理。如果密钥采用人为指定的方式产生,安全性通常会不高,毕竟人们更倾向于选择容易记忆的数字或字母来做密钥。所以我们采用了密钥由随机数发生器自动产生的方式,确保密钥随机产生,提高安全性能。为了数据的安全,密钥必须定期更新。我们为密钥设置一个有效期限,如果密钥的上次更新时间与当前时间间隔超过密钥有效期限,系统中的密钥更新程序会提示进行密钥的更新操作。为了防止密钥更新过程中出现查询错误,将加密操作与索引查询操作设为互斥操作,这样用户在访问数据的过程中就不会出现错误。

参考文献:

[1]朱良根、雷振甲、张玉清,数据库安全技术研究.计算机应用研究,2004,9.

[2]Oracle.Oracle9i database security for e-business. An Oracle White Paper,2001,6.

全文检索篇2

关键字:全文检索;倒排文件;Lucerne;全文数据库;自动分词

中图分类号:[G257.5] 文献标识码:A

一、全文检索技术简介

(一)什么是全文检索

全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的 检索方式。这个过程类似于通过字典中的检索字表查字的过程。总之,全文检索技术是现代信息检索的一项重要技术。

(二)全文检索需要解决的问题

一套完整的全文检索一般包括: 1 对不同文本的统一处理; 2 索引的建立;3 对汉语词语进行正确的切分;4 检索问题;5 排序问题5 个问题进行分析与研究。

二、建立索引库

(一)索引文件分类

1.顺排档结构

顺排档文档是以 Decide 为主序的, 每一文档下存放各自出现的词的 ID 及各词所出现的次数和具置信息,各数据项的存储长度固定。

2.倒排档结构

(1) 一级索引:一级索引文件属于记录式文件,每一记录大小固定, 共有三个数据项构成, Word ID、 文档数、 第一个文档开始位置。 其中 Word ID 是词典中词条的 ID,文档数是指这个词总共在多少个文档中出现,文档开始位置是一个文件指针指向二级索引中出现当前词的文档集中的第一 个文档存储位置, 这个指针是一个长整形值相当于指明了是二级索引文件 中的第几条记录,因为各记录长度也是固定大小。通过这个指向可以直接 定位到二级索引文件读取位置,然后读取 n Docs 个记录即可,因为它们是存放在连续的地址空间上。

(2) 二级索引:二级索引也是一种记录式文件,每一记录有三个数据 项组成,Doc ID、出现次数、第一个 Hit 位置。其中 Doc ID 是文档的 ID, 出现次数指的是当前文档中某一个词出现的次数, 第一个 Hit 位置也是一 个指针,指向 Hits 文件中的某一位置。通过这个指针就可以直接定位到 Hits 位置中的读取位置,这样连续读取 n Hits 个记录就可以将所有当前词在当前文档中的出现的位置信息都读入。这些文件将属于同一 Word ID下的所有文档记录按其词在整个文档的权值从大到小排列。

(3) Hits 位置信息文件:这些文件每一记录只有一个数据项,即 Hit 位置信息,只记录了各词在文档中出现的位置。将同一词在同一文档中的 出现位置按出现的先后排列。 这样在读取文档并提取摘要时只需对字符串 从头到尾扫描一边即可,不需要来回扫描。

(二)倒排索引压缩

1.Lucerne 压缩技术

为了减小索引文件的大小,Lucene 对索引也使用了压缩技术。首先, 对词典文件中的关键词进行了压缩,关键词压缩为,例 如:当前词为“阿拉伯语” ,上一个词为“阿拉伯” ,那么“阿拉伯语”压 缩为。其次大量用到的是对数字的压缩,数字只保存与上一个值 的差值(这样可以减小数字的长度,进而减少保存该数字需要的字节数) 。 例如当前文章号是 16389(不压缩要用 3 个字节保存) ,上一文章号是 16382,压缩后保存 7(只用一个字节) 注意是“上一个词” 。 。由于词典 词典 是按顺序排列的,这种压缩方法的效果会非常显著。 是按顺序排列的

2. 动态文本集的倒排索引压缩方案

我们考虑文本集动态性时, 将文本内部的动态调整用两次文本层次的调整代替,即对一个文本作文字改动视为删除旧文本和增加新文本,因此一般只考虑文本层次的索引动态同步调整。位置序列记录的是某单词在一个文本内部的位置,由于只考虑文本层次的增加、删除,所以该序列内部的值不会发生任何的改动,它是静态的,可以采用压缩率较高的任何压缩方法。与文档ID 序列和词频序列相比,位置序列占用的索引空间往往多于二者,故而位置序列的压缩对整个倒排索引的压缩率起决定性作用。到目前为止,压缩率最高的首推二进制内插编码,虽然它的压缩与解压比较耗时,但与由压缩减少的 I/O 时间相比,可以忽略,因此我们可以对位置序列采用二进制内插编码。

三、中文分词研究

我们讨论的分词算法可分为三大类:基于字典、词库匹配的分词方法;基于词频度统计的分词方法和基于知识理解的分词方法。

(一)基于字典、词库匹配的分词方法

这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。

常用的几种机械分词方法如下:

1.最大正向匹配法 (MaximumMatchingMethod)通常简称为MM法

2.逆向最大匹配法 (RecerseMaximumMatchingMethod))通常简称为RMM法

3.最少切分法:使每一句中切出的词数最小。

(二)全切分和基于词的频度统计的分词方法

基于词的频度统计的分词方法是一种全切分方法。在讨论这个方法之前我们先要明白有关全切分的相关内容。

1.全切分

全切分要求获得输入序列的所有可接受的切分形式,而部分切分只取得一种或几种可接受的切分形式,由于部分切分忽略了可能的其他切分形式,所以建立在部分切分基础上的分词方法不管采取何种歧义纠正策略,都可能会遗漏正确的切分,造成分词错误或失败。而建立在全切分基础上的分词方法,由于全切分取得了所有可能的切分形式,因而从根本上避免了可能切分形式的遗漏,克服了部分切分方法的缺陷。

全切分算法能取得所有可能的切分形式,它的句子覆盖率和分词覆盖率均为100%,但全切分分词并没有在文本处理中广泛地采用。

2.基于词的频度统计的分词方法:

这是一种全切分方法。它不依靠词典,而是将文章中任意两个字同时出现的频率进行统计,次数越高的就可能是一个词。它首先切分出与词表匹配的所有可能的词,运用统计语言模型和决策算法决定最优的切分结果。它的优点在于可以发现所有的切分歧义并且容易将新词提取出来。

3.基于知识理解的分词方法

该方法主要基于句法、语法分析,并结合语义分析,通过对上下文内容所提供信息的分析对词进行定界,它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断。

4.一种新的分词方法

并行分词方法:这种分词方法借助于一个含有分词词库的管道进行 ,比较匹配过程是分步进行的 ,每一步可以对进入管道中的词同时与词库中相应的词进行比较 ,由于同时有多个词进行比较匹配 ,因而分词速度可以大幅度提高。这种方法涉及到多级内码理论和管道的词典数据结构。

四、索引数据库的搜索

(一) lucent 搜索算法

1.把.tic 文件调入内存。

2.在内存中用二分查找找到相应的 Block。

3. 把.tis 文件中相应的 Block 调入内存。

4. 在 Block 中顺序找到相应的 Term。

5 .Term 在索引里是有序排列的。

6 采用二分查找机制来定位索引里的 Term。 在 Index 包 TermInfosReader 类中的实现代码。 Private final into getIndexOffset (Term term) throws I Exception {into lo = 0; // binary search index Terms []

Nit hi = indexTerms.length - 1; while (hi >= lo) {into mid = (lo + hi) >> 1; nit delta = pareTo (index Terms [mid]); if (delta < 0)hi = mid - 1; else if (delta > 0) lo = mid + 1; else return mid; } return hi; }

(二)搜索过程优化

lucent 支持内存索引:这样的搜索比基于文件的 I/O 有数量级的速度提升。而尽可能减少 Index Searcher 的创建和对搜索结果的前台的缓存也是必要的。Lucerne 面向全文检索的优化在于首次索引检索后,并不把所有的记录(Document)具体内容读取出来,而起只将所有结果中匹配度最高的头100 条结果(To-Dos)的 ID 放到结果集缓存中并返回,这里可以比较一下数据库检索:如果是一个 10,000 条的数据库检索结果集,数据库是一 定要把所有记录内容都取得以后再开始返回给应用结果集的。所以即使检索匹配总数很多,Lucerne 的结果集占用的内存空间也不会很多。对于一般的模糊检索应用是用不到这么多的结果的,头100 条已经可以满足 90% 以上的检索需求。

(三)词库查找方法

词库的查找过程其实是一个典型的字典问题(dictionary problem),可以使用三类方法。1.一类是基于单词比较(comparison based)的方法;2.第二类是基于表示法(representation based)的方法;3.第三类则是无需经过任何比较, 一次存取便能得到所查单词位置的散列法。通过对单词 K 作某种算术运算 f(K),计算的结果就是 K 及其相关数 据的存储位置[3]。若对于不同的单词得到同一散列值,便产生了冲突。 冲突会降低查询效率,因此应尽量避免。

参考文献

[1] D.Cutting, J.Pedersen.Optimization for Dynamic Inverted Index Maintenance.in: Proceedings of the 13thAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval.Brussels, Belgium.1990.New York: ACM Press, 1990.405~411

[2]罗晓沛等.数据库技术(高级).北京:清华大学出版社, 1999:102-103. [2] Google 搜索引擎技术实现探究 化柏林 中国科学技术信息研究所

[3]中文搜索引擎技术揭密:中文分词

[4]Lucerne 算法介绍 作者:胡晓光 作者:车东

崔柏(1972-),男,河北联合大学理学院,实验师,本科;研究方向:图书学与信息学技术

全文检索篇3

关键词:B/S结构;SQL Server 2000;全文检索;网络考试

中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)09-1976-03

The SQL Server 2000's Full Text Retrieval in Paperless Examination System

WANG Jia-qi1, YU Hai-xia2, LIU Jing-jie2

(1.Anhui Vocational & Technical College of Industry & Trade, Huainan 232007, China; 2.Anhui Vocational & Technical College of Industry & Trade, Huainan 232007, China)

Abstract: Full text search technology is accurate from a mass of information, find the information that the most effective means of improving the efficiency of retrieval of massive volumes of documents. This article describes the SQL Server 2000 full-text search technology in the paperless examination subsystems of the specific application, the system uses the B/S, the business layer uses the C# language development, user interface development using .

Key words: B/S structure; SQL Server 2000; full-text retrieval; network testing

1 概述

随着计算机应用技术和网络技术的高速发展及应用领域的扩大,利用网络实施无纸化考试的方式也越来受到重视,本课题组在结合学院的实际需要及校园网络的现状,提出建设一个适合学院自身要求的无纸化考试子系统,以满足高职学院提高考试管理效率的应用需求。在该系统的查询模块中应用了全文检索技术,除提供按标题、关键字等信息的基本查询功能外,还能够快速便捷地查询全文电子文档。该系统应用的是微软SQL Server 2000全文检索技术,其具有查询速度快、命中率高等优点。本文就SQL Server 2000全文检索技术在无纸化考试系统中的应用进行介绍。

2 全文检索及其发展状况简介

全文检索[1](Full-Text Retrieval)是指以全文本信息作为检索对象,通过建立全文数据库,具有布尔逻辑检索功及文本检索功能,允许用户以自然语言检索,最终获得原文中的相关章节和语句。

在现代,计算机信息检索系统经历了四个发展阶段,第一阶段是众多信息检索系统,建立于1971年以前,其工作方式是传统的批处理检索方式;第二阶段是联机情报检索系统,是在1971年以后产生并发展的,特点是建立集中管理的联机数据库,拥有数据库联机检索功能,缺点是数据通信能力较差;第三阶段是以Internet的应用为标志,优点是采用分布式网络管理,缺点是信息资源分布无序,难于规范化和结构化;第四阶段是在前三个阶段的基础上,随着网络和数据库技术的不断发展,计算机信息检索系统跨入了一个新的阶段。

我国在80年代初期才开始计算机全文检索技术的研究,主要的应用在计算机编制主题词表、汉语自动分词、数据库构造、情报检索、联机检索、机器翻译、图书馆业务管理、全文检索理论等领域,并取得了很大进步。经过十几年的发展,我国的全文检索技术虽然取得了巨大的进步,但是与国外的全文检索技术还存在一定的差距。

目前,主要有两种实现全文检索的技术[2],一是关键词直接匹配法,即根据关键字在文章内直接检索,优点是由于没有建立关键词索引库,因此所占空间较少,缺点是没有关键词索引库,所以在进行全文匹配时要花费大量的时间;二是倒排全文索引法,通过建立倒排全文索引库的方法,节省了检索时间,当然需要占用一定的存储空间来建立全文索引库。

现在,随着计算机存储技术的高速发展以及海量信息的出现,传统的文献数据库正经书目数据库转变为全文数据库,这一转变使得全文检索技术研究得到了高速发展,众多的研究机构、商业组织都积极参研究。一些软件公司也适时推出全文检索软件,国内的有TRS(易宝北信)、MIRS(北大方正)和海文Quick等,而国外较著名的就是下文将要介绍的Microsoft公司开发的SQL系统。本项目采用的是SQL Server 2000系统。

3 SQL Server 2000全文检索服务流程的实现

检索服务的流程图如图1所示。

检索服务流程的主要步骤包括[3]:

1) 应用程序向SQL Server 2000发送带全文构造的SQL语句;

2) SQL Server 2000关系引擎通过查询系统表验证该构造,确定全文引索是否覆盖引用。并将每个语句简化为一系列的行集操作,并通过OLE DB把这些操作传递给基础组件(如存储引擎)。关系引擎的作用是将任何全文构造转换为对行集的请求;

3) 全文提供程序验证请求并将搜索条件更改为符合搜索服务的查询支持组件使用的形式,将请求发送到搜索服务;

4) 查询支持组件使用搜索引擎组件从全文索引析取所请求的数据,然后以行集的形式将这些数据反馈给全文提供程序;

5) 全文提供程序将此行集返回给关系引擎;

6) 关系引擎将它从存储引擎和全文提供程序收到的全部行集进行组合,生成发送到客户端的最终结果集。

4 SQL Server 2000全文检索服务的应用[4-5]

在系统里,实现全文检索服务分为三个步骤,分别是配置全文检索服务、实现全文检索服务和WEB应用。下面就来详细阐述:

4.1 配置SQL Server 2000的全文检索服务

1)建立名为ShijuanData的全文数据库,并建立Shijuan表,包含的字段有shijuan_id(存放试卷编号,int型,长度为4,非空,设为标知,种子为1,自动增量为1)、shijuan_Aitle(存放试卷题目,vchar型,长度为200,非空)、shijuan_abstract(存放试卷摘要, vchar型,长度为8000,非空)。

2)为Shijuan表建立唯一索引(Unique Index) ,以便建立全文索引。方法是确保Shijuan表中的shijuan_id字段为唯一索引。

3)为表Shijuan添加数据。

4)在SQL Server的企业管理器中,选中数据库ShijuanData。选择“全文目录”。点击右键,选择“新建全文目录”,建立全文目录Shijuan-AbstractFullSearch,然后建立名称为AbstraetSearch的调度,其他接受默认。

5)选中Shijuan表,单击右键,选中“全文索引表”,选择“在表上建立全文索引”后会出现“全文索引向导”窗口,点击“下一步”会出现“选择索引”窗口,选择唯一索引“shijuan_id”,再“下一步”,显示“选择表中的列”窗口,在该窗口里选择“shijuan_abstract”字段,再“下一步”,出现“选择目录”窗口,接受默认配置,再“下一步”,出现了“选择或创建填充调度(可选)”窗口,接受默认配置,再“下一步”,出现“正在完成SQL Server全文索引向导”,单击“完成”。

6)选中Shijuan表,单击右键,选“全文索引表”,点击“启动完全填充”,等待完成。

7)选择ODBC管理器里的“系统DSN”, 点击“添加”,选“SQL Server”,为“数据源名”添加值:ShijuanData,再进行客户配置,实现“数据源名”的配置。

8)为了保证全文索引库能够与表Shijuan的修改同步,必须在修改(包括添加、删除记录和对原记录进行编辑) Shijuan表后,立即重复6)的操作。

完成上述步骤后就实现了SQL Server全文检索服务的配置。

4.2 全文检索服务[6]的实现

在SQL Server 2000中,通过使用CONTAINS和FREETEXT语句来实现全文检索,两者的区别是CONTAINS是完全匹配查询,而FREETEXT是部分匹配查询。例如,搜索“CProgram”时,使用CONTAINS表示查询所有与 “CProgram”匹配的结果,使用FREETEXT表示查询所有匹配“CProgram”或“C”或“Program”的结果。

下面对这两者进行详细的阐述:

1)CONTAINS语句

语法格式为:

CONTAINS({col | *},‘keyword’)

其中,col为被搜索的指定列,使用*时说明对表中所有全文索引列进行搜索,单引号中的内容为搜索关键词。

例如,下面语句检索shijuan表的shijuan_Aitle列包含‘C语言’或‘试卷’字符串的信息:

select shijuan_Aitle from shijuan where contains(shijuan_Aitle,‘C语言’)

or contains(shijuan_Aitle,‘试卷’)

2)FREETEXT语句

语法格式为:

FREETEXT({col | * },‘keyword’)

其中,col为被搜索的指定列,使用*时说明对表中的所有全文索引列进行搜索,单引号中的内容为搜索关键词。

例如,下面语句使用FREETEXT语句搜索shijuan表中包含‘C语言’的信息:

select shijuan_Aitle from shijuan where freetext (*,‘C语言’)

4.3 全文检索技术的应用

本系统采用B/S模式,搭建一个基于Web界面的全文检索平台,利用SearchFile.aspx页面将关键词提交给Web服务器,并通过SearchResult.aspx页面将检索结果反馈给用户,实现过程是通过调用控件对SQL Server 2000数据库进行全文查询。全文检索的应用页面见图2和图3:

图2 查询页面 图3 结果页面

5 结束语

在本系统中,得力于全文检索技术的应用,实现了提高查询效率、缩短查询时间的目标。通过对SQL Server 2000全文检索服务在该系统的应用,该技术有两处优势:

1)简单易用。全文检索服务是SQL Server 2000数据库系统的组成部分,可以使用标准的SQL语句实现全文检索,并可以使用“企业管理器”对全文检索进行图形界面管理。

2)SQL Server 2000提供了丰富的实用功能。如其提供的“噪音词”(noiseterm )过滤机制,是利用记录“停用词表”的“noise.dat”文件,其位于“.MSSQL\TDATA\SQL Server\config”目录中,实现过滤一些不具备检索意义或特定的词(如:a、you等)。用户可在应用过程中可修改“noise.dat”文件内容,实现特定词汇的过滤功能。

但SQL Server 2000的全文检索也存在一些不足,如:需要人工进行重新索引被修改的全文索引字段,而不能够自动完成重新索引工作;另外由于要为数据库建立全文索引,故在计算机硬件配置方面要求较高。相信这些不足会随着计算机软硬件的发展及SQL Server 2000软件技术实现手段的提升而得到改善,并可以最大效率发挥全文检索的作用。

参考文献:

[1] 张涛.全文检索技术及其发展前景[J].数理医药学杂志,2003(4).

[2] 钱爱兵.全文检索算法设计及全文检索系统概述[J].现代图书情报技术,2003(2).

[3] 刘君.SQL Server 2000中全文检索的使用[J].中国数据通信,2001(12).

[4] 邹建.中文版SQL Server 2000开发与管理应用实例[M].北京:人民邮电出版社,2005.

[5] 王俊伟.SQL Server 2000中文版-数据库管理与应用标准教材[M].北京:清华大学出版社,2006.

全文检索篇4

一、前 言

计算机的日益普及和计算机技术日益成熟,使得计算机在工业控制监测中的应用渐渐深入。但工业应用不同于其它方面,它要求有较强的实时性。现在有很多的DOS软件在运行过程中通过挂接外部中断方式实现DOS应用软件与外设的实时通信,这种方法实现起来十分简单。而在Windows中应用程序能否也能够利用外部硬中断实现外设与Windows应用程序的实时通信呢?答案是肯定的。这里的关键是要解决好中断代码与Windows应用程序相互之间交换信息的问题。

从外设发送异步的硬中断,通过中断处理程序传递一条信息给Windows应用程序。这时可以初始化相关端口,准备好数据,然后进行数据传送,从而做到实时通信。

实现Windows应用程序响应外部中断的方法有很多,如Microsoft公司自己开发的SDK、DDK软件包,使用嵌入式汇编等等。本文将介绍一种在BC++3.1的基础上利用Windows 3.1拥有的一些功能实现Windows实时通信的实例。

二、中断代码的位置

在Windows中,几乎所有的异步事件都是由中断处理程序来管理的。中断处理程序包含在设备驱动程序中,由Windows在环境初始化中安装。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中断处理程序,以处理相应的键盘、鼠标和串行口的异步中断。可以仿照标准设备驱动程序,编写中断处理代码,以响应外设的通信请求,从而完成一次实时通信。

中断代码既可以包含在应用程序的可执行代码中,也可以包含在动态连接库(DLL)中。包含在应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以在Windows系统中所有的应用程序所共享。这样不仅在整个Windows系统中只有一个中断代码的副本,提高了内存的使用效率,更重要的是可以防止由于同时存在多个中断代码的副本而发生冲突。本文将在DLL中编制中断处理程序。

当动态连接库被装入时,要调用DLL库的入口点LibMain(),利用这一点可以执行一些初始化工作,可以分配一些内存块,可以初始化一些全局变量或者静态变量,可以安装中断服务程序的代码等等。例如:

void interrupt (oldIsr)(--CPPARGS)

/* 旧的中断服务程序地址 */

LibMain(HANDLE hInstance,WORD wDataSeg,WORD cbHeapSize,L

PSTR

lpszCmdLine)

{

oldIsr=getvect(IRQNum);

/* IRQNum指中断号 */

setvect(IRQNum,newIsr);

/* newIsr指新中断服务程序代码 */

return(1);

}

函数setvect()既可在实模式下,也可在保护模式下设置中断处理向量。

上述代码也可以放在一个由用户设置的引出(export)函数中,在应用程序中用户可以调用此引出函数来安装中断服务程序代码。

由于中断可以在任何时刻发生,中断代码必须驻留在内存中,并且在应用程序运行的过程中一直处于某一固定内存中。这一点无论是在实模式还是在保护模式下都是一致的。

在DLL的模块定义文件中应注意:

1.CODE语句为固定代码段,即FIXED;

2.EXPORTS语句要引出被应用程序和其它DLL用作入口点的函数。

三、通信机制

编写实时通信例程关键在于必须认识到,异步事件对应用程序的触发是异步发生的,不在Windows的消息处理机制和多任务范围内。为了使通信例程能够正确地工作,通信例程必须通知Windows有异步事件发生,且不能打断应用程序的任务管理或消息流。要作到这一点,通信例程必须通过调用PostMessage或PostAppMessage函数向应用程序的消息队列中加入一条消息。

需要注意的是,在DLL中调用PostMessage(HWND hwnd, …)时,必须先确定hwnd的实际值,可以通过使用引出函数的办法来实现,如下所示:

static HWND hWndApp;

void FAR PASCAL SetIsrWin(HWND hwnd)

{

hWndApp=hwnd;

} 然后在应用程序的窗口函数中,对WM-CREATE消息进行处理时调用此函数来初始化DLL中的静态变量hWndApp:

CASE WM-CREATE:

SetIsrWin(hwnd); /* hwnd指应用程序窗口句柄 */

定义一个在应用程序中使用的消息:

#define ISRM-RUPT WM-USER+255最后在DLL中的中断服务程序代码中,调用PostMessage即可完成Windows应用程序和中断服务程序代码相互的信息交流:

void interrupt newIsr(--CPPARGS)

{

PostMessage(hWndApp,WM-RUPT,wParam,lParam);

}

四、程序实例

本示例先安装在DLL中的外中断服务代码,通过386/AT总线上的中断申请线(IRQ12)外触发,由中断服务代码发送一条消息WM-RUPT通知Windows应用程序外设有实时通信请求,应用程序收到这条消息后,在窗口用户区显示一条信息,表明已和外设联络上,并同时鸣叫一声喇叭。

程序分为两部分:DLL库代码和Windows应用程序代码。

1.DLL库代码

/*----------*

* interrupt include file,named handle.h*

*----------*/

void FAR PASCAL SetIsrWin(HWND hwnd);

void FAR PASCAL SetIRQNum(unsigned char IRQ);

/*----------*

* module defination file, named handle.def *

*----------*/

LIBRARY HANDLE

EXETYPES WINDOWS

STUB 'WINSTUB.EXE'

CODE PRELOAD FIXED

DATA PRELOAD SINGLE

HEAPSIZE 1024

EXPORTS

WEP

@1 RESIDENTNAME

SetIRQNum @3

/*----------*

* interrupt service program in dll,named handle.dll *

全文检索篇5

19822615 构建现代职业教育体系的若干政策思考 马树超 范唯 郭扬 《教育发展研究》 2011年第21期 10300字

19822616 开放教育与高等职业教育的对冲——大众化高等教育背景下开放大学的制度设计 许涛 《开放教育研究》 2011年第6期 14100字

19822617 我国普通高校投资的几点变化 沈百福 高菁 《复旦教育论坛》 2011年第6期 12000字

19822618 普通教育和职业教育关系的历史演进 孟景舟 《职教论坛》 2011年第31期 10100字

19822619 “提升”与“健全”思辨——关于职业教育体系的思考之二 张振元 《职业技术教育》 2011年第31期 8800字

19822620 资源配置优化视角的职业教育发展模式创新分析 王奕俊 王建初 《职业技术教育》 2011年第31期 7000字

19822621 文化同构境域:职教城乡一体化发展的体制与机制研究 梁成艾 全 《教育与职业》 2011年第33期 10600字

19822622 全国职业院校技能大赛对职业教育理念和观念的影响 秦虹 胡洁 《教育研究》 2011年第11期 9100字

19822623 浙江省区域高职教育发展路径战略选择 王向红 《中国高教研究》 2011年第11期 7200字

19822624 加强省级研究生教育质量保障机制建设的探讨 夏清泉 陈伟 《学位与研究生教育》 2011年第11期 6400字

19822625 广东高职院校人才培养社会适应性现状分析 罗艳 《职业教育研究》 2011年第11期 7700字

19822626 全国不同地区中等职业教育发展水平综合评价 陈嵩 马树超 《职教论坛》 2011年第31期 6100字

19822627 基于产业结构调整视角的东莞高职教育发展研究 蒋键 陈搏 《教育与职业》 2011年第33期 8000字

19822628 江苏省职业教育创新发展实验区建设研究 徐健 《教育与职业》 2011年第32期 7900字

19822629 以学生得益为主旨:顶岗实习的目标架构 郦昕阳 《高等教育研究》 2011年第11期 8500字

19822630 高职院校专业带头人建设机制研究 周建松 《高等工程教育研究》 2011年第6期 7900字

19822631 论高等职业院校学术力建设 马必学 刘晓欢 《中国高等教育》 2011年第21期 6500字

19822632 论高等学校人才培养模式及其改革 别敦荣 《中国大学教学》 2011年第11期 6500字

19822633 职业教育的文化使命及其实现 刘义国 《国家教育行政学院学报》 2011年第11期 6700字

19822634 学院主导:江苏高等职业教育集团化发展之创新——以江苏联合职业技术学院为例 王明伦 《中国职业技术教育》 2011年第33期 8200字

19822635 促进高等职业教育科学发展的哲学辩析 苏小柱 《职教论坛》 2011年第32期 6100字

19822636 中高职衔接的历史逻辑、现实困境及其超越 刘辉 王海亮 《职业技术教育》 2011年第31期 12300字

19822637 职业化、专业化、人的现代化:高职人才培养的三维质量标准 徐海峰 《职业技术教育》 2011年第31期 8700字

19822638 职业教育集团持续发展的实践探索与思考 张良 文振华 《职业技术教育》 2011年第32期 6900字

19822639 应用型本科发展:观点、经验与路径 李玉静 刘海 《职业技术教育》 2011年第33期 8400字

19822640 产教合作走向制度化 张祺午 《职业技术教育》 2011年第33期 6300字

19822641 多元合作是教学服务型大学实现功能定位的必然选择 孙惠敏 《职业技术教育》 2011年第33期 6300字

19822642 高职院校办学定位存在的问题及对策 朱志海 《教育与职业》 2011年第32期 5500字

19822643 高职教育专业群建设:概念、内涵与机制 沈建根 石伟平 《中国高教研究》 2011年第11期 7300字

19822644 关于高职院校工学结合课程学习能力评判体系构建 阳彦雄 杨庆君 《职业教育研究》 2011年第11期 8900字

19822645 高职课程整合视阈:课程项目化与项目课程化 张健 《职业技术教育》 2011年第32期 6800字

19822646 职业教育课程资源理念拓展研究 马庆发 《职教通讯》 2011年第21期 6600字

19822647 高职“导游实务”理实一体化课程建设 祖鹏 《职教通讯》 2011年第22期 6500字

19822648 论我国农村教师培训系统的重建 朱旭东 《教师教育研究》 2011年第6期 13500字

19822649 民办高职院校师源性心理伤害研究 黄晓星 《职业教育研究》 2011年第11期 6700字

19822650 基于工作过程的高职java课程教学实践 刘学超 李玉霜 《中国职业技术教育》 2011年第32期 5100字

19822651 我国职教教师资格制度有效性的制度分析——制度质量的视角 查吉德 《职教论坛》 2011年第31期 10100字

19822652 经侦案例教学探析 王俊家 《职业技术教育》 2011年第32期 6700字

19822653 高职院校兼职教师管理存在的问题及对策 王国庆 《职业技术教育》 2011年第32期 5100字

19822654 农村职业教育发展的现实诉求与实践教学创新 魏明 郝理想 《中国职业技术教育》 2011年第33期 6600字

19822655 新农村建设视角下供销合作社职业教育:现状、问题及发展对策 张亿均 《职教论坛》 2011年第33期 8100字

19822656 农民工培训的公益性及其保障 张胜军 《职业技术教育》 2011年第31期 8800字

19822657 职教强农 九部联动 陈衍 《职业技术教育》 2011年第33期 14700字

19822658 农村职业教育服务“三农”施教路径研究 苏兆荣 李亚云 徐仁静 《职教通讯》 2011年第21期 6500字

19822659 全纳成人教育:成人教育可持续发展的必由之路 徐君 《教育发展研究》 2011年第21期 8600字

19822660 我国从业人员参与在职培训影响因素研究 李湘萍 《中国职业技术教育》 2011年第33期 14000字

19822661 呼吁建立健全农村基层干部培训机制与体系——基于吉林省的调查 赵云昌 黄玉霞 孟凡茹 《职业技术教育》 2011年第33期 6200字

19822662 我国社区教育的发展:反思与进路 饶冠俊 陈慧 《中国成人教育》 2011年第21期 16100字

19822663 基于区域经济视角的社区教育发展个案研究 李伟林 《中国远程教育》 2011年第21期 9500字

19822664 民办高校发展面临的“高原现象”探析——以陕西民办普通高校为例 王庆如 司晓宏 《高等教育研究》 2011年第11期 15100字

19822665 高职学生社会主义核心价值观践行能力的培育 贾迅 《高教探索》 2011年第6期 7100字

19822666 后现代反本质主义时代的教育本质观 张正江 《教育理论与实践》 2011年第11期 10300字

19822667 高职学生心理韧性调查分析——以江苏省三所高职院校为例 郭峰 汪志兵 《职业技术教育》 2011年第31期 7100字

19822668 基于“思想导师制”的高职思想政治教育模式实践 雷久相 《职业技术教育》 2011年第32期 6600字

19822669 对我国职业院校学生职业道德发展状况的诊断研究 赵志群 杨琳 《职教通讯》 2011年第21期 11500字

19822670 “父子相传”、“师徒相授”:特点与作用——中国手工业文化传承方式研究之一 孟凡华 《职业技术教育》 2011年第31期 5300字

19822671 箕裘相继——民间传统技艺家传制度研究 路宝利 赵友 宋绍富 《职业技术教育》 2011年第31期 10600字

19822672 从“教学做合一”到“做学教合一”——徐德春的教育理论及实践 石娟 《职业技术教育》 2011年第33期 6300字

19822673 国外高等职业教育中学生教学参与评价方法述评及启示 吴海荣 《职业教育研究》 2011年第11期 8400字

19822674 小企业家培训:美国社区学院的职能发展及其启示 吴迪 罗尧成 《中国职业技术教育》 2011年第33期 6500字

19822675 由西南悉尼TAFE学院审视澳大利亚的职业教育与培训 万力维 《职教论坛》 2011年第33期 8000字

19822676 西方现代学徒制的特征及启示 关晶 石伟平 《职业技术教育》 2011年第31期 12300字

19822677 南昆士兰大学学习与教学支持服务机构运行经验及启示 张胜利 何岸 《职业技术教育》 2011年第32期 5200字

19822678 欧洲职业教育与培训模式的特征及发展趋势 冉玉 《教育与职业》 2011年第32期 7800字

19822679 论印度高等技术院校的教师任用标准 安双宏 《比较教育研究》 2011年第11期 6700字

19822680 越南21世纪教育发展的新战略:理念、目标及策略 欧以克 《外国教育研究》 2011年第11期 8600字

19822681 美国南部地区高等教育及其与中国的教育交流 魏礼庆 《世界教育信息》 2011年第11期 5300字

19822682 当代西方教育政策研究新进展:组织的视角 黄忠敬 《全球教育展望》 2011年第11期 8700字

全文检索篇6

职业技术教育杂志社承办

19824539 高职院校需求导向问题和研究路径 丁金昌 《教育研究》 2014年第3期 8800字

19824540 全球公民社会与全球公民教育 冯建军 《高等教育研究》 2014年第3期 16500字

19824541 大众化十年:我国高等教育机会公平水平的发展变化 张继平 《中国高教研究》 2014年第3期 15200字

19824542 高等教育“管办评分离”的缘由与路径 周海涛 《国家教育行政学院学报》 2014年第3期 10100字

19824543 教育现代性研究的进展及其阐释空间的拓展 金业文 《现代大学教育》 2014年第2期 12300字

19824544 教育政策行动:解释与分析框架 曾荣光 《北京大学教育评论》 2014年第1期 24300字

19824545 监测评估:高等教育评估发展的新图景 王战军 王永林 《复旦教育论坛》 2014年第2期 9400字

19824546 中职免学费政策评估:目标保障与配套策略建构 魏明 张艳 《职教论坛》 2014年第7期 8100字

19824547 我国现代职业教育体系构建存在的问题及完善对策 肖化移 柳燕 《职教通讯》 2014年第7期 7000字

19824548 我国高职教育现代性演进及增长路径 吴结 《职业技术教育》 2014年第7期 8800字

19824549 政府应如何主导职业教育 喻忠恩 《职业技术教育》 2014年第7期 7000字

19824550 打造“升级版”的中国特色高等职业教育 郭广军 刘兰明 林春明 《教育与职业》 2014年第7期 7900字

19824551 企业视角下的职业教育教学改革 陈继权 《中国职业技术教育》 2014年第8期 9800字

19824552 高职教育发展转型:意义、方式与路径 张健 《中国职业技术教育》 2014年第9期 11500字

19824553 经济先发地区农村中等职业教育的转型――以浙江省为例 皮江红 《教育发展研究》 2014年第5期 13800字

19824554 六省市中等职业教育招生情况调研报告 中华职业教育社调研组 《职业技术教育》 2014年第9期 9800字

19824555 河南省高职院校竞争力的“五力模型”分析 陈一静 《教育与职业》 2014年第7期 7900字

19824556 新时期支撑区域经济发展的高职院校办学结构调整分析 倪敏 《教育与职业》 2014年第7期 7900字

19824557 高等职业教育对天津市经济增长的贡献率研究 穆静静 张学英 《职业教育研究》 2014年第3期 13400字

19824558 现代职业教育体系建设背景下行业、企业办学研究 郭静 《教育研究》 2014年第3期 10600字

19824559 新型应用型本科院校发展定位、使命、路径和方法选择 陈小虎 《中国大学教学》 2014年第3期 17200字

19824560 城镇化进程中校企合作双方责任与权益配置及其效率研究 李梦卿 张欢 《职教论坛》 2014年第7期 10100字

19824561 全国职业院校技能大赛对技能人才培养的价值与作用 吕景泉 汤晓华 周志刚 《职业技术教育》 2014年第9期 6000字

19824562 高职人才培养目标的演进与重构 郭俊朝 陈晗 《职教通讯》 2014年第7期 7000字

19824563 我国职业教育校企合作研究的回顾与思考 李露 徐涵 《职教通讯》 2014年第7期 12300字

19824564 基于职业能力培养的高职实训支持体系架构 陈建新 蓝洁 《职业技术教育》 2014年第7期 8800字

19824565 应用型人才内涵及应用型本科人才培养 吴中江 黄成亮 《高等工程教育研究》 2014年第2期 8800字

19824566 以职业岗位能力为导向 创建应用型人才培养模式 吴旭君 《中国高等教育》 2014年第5期 6100字

19824567 我国高职本科教育的现状、困境和对策研究 汪亚明 王珏 《中国高教研究》 2014年第3期 10100字

19824568 高等职业教育金融支持的新模式:校企联合定向办学 王临 《江苏高教》 2014年第2期 5100字

19824569 基于学分银行制的中高职教育衔接系统建构 邱淑女 《教育与职业》 2014年第7期 7900字

19824570 职业教育产学合作的制度尴尬与调适――基于政府职能的视角 陈春阳 《中国职业技术教育》 2014年第9期 6600字

19824571 城乡统筹视野下的职业教育结构均衡与优化 廖晓衡 全 《中国职业技术教育》 2014年第9期 11500字

19824572 辽宁省高职教育专业设置现状分析与建议 孙莹 闫丹 《职业技术教育》 2014年第8期 6800字

19824573 学科知识的逻辑与学科范式的构建――基于职业导向的高校学科建设分析 俞涛 曾令奇 《职业技术教育》 2014年第7期 10600字

19824574 高校教师教学发展中心的实践课题 吴洪富 《高等教育研究》 2014年第3期 16200字

19824575 关于高等职业教育精细化建设专业的思考 骆秋琴 《高等工程教育研究》 2014年第2期 7000字

19824576 基于终身教育理念的高职专业教学标准开发 漆军 等 《中国高等教育》 2014年第5期 7300字

19824577 基于模块化课程设计的中高职教育衔接的问题与对策 彭鸿 《教育与职业》 2014年第7期 7900字

19824578 基于区域经济发展的江苏高职模具专业教学标准开发 陈国亮 王春艳 《职业教育研究》 2014年第3期 6700字

19824579 论职业院校教师专业化发展路径 邢广陆 《职教论坛》 2014年第8期 12100字

19824580 慕课背景下高职英语教学改革初探 霍红 刘妍 《职业技术教育》 2014年第8期 5100字

19824581 从项目化到制度化:我国职业教育教师培养体系的设计 徐国庆 《教育发展研究》 2014年第5期 11800字

19824582 “双师型”视阈下职教师资培训工作发展研究 李梦卿 万娥 《教育发展研究》 2014年第5期 11900字

19824583 高职院校教师激励模型的验证性因素分析――基于28所高职院校的抽样调查 何霞 刘文明 《中国高教研究》 2014年第3期 14800字

19824584 基于知识结构的高职院校教师生存特征比较 何霞 《高教探索》 2014年第2期 14700字

19824585 近年来农村职业教育发展述评 房风文 《职教论坛》 2014年第7期 8100字

19824586 受众本位论视角下农民田间学校发展定位探析 何津 黄圣男 王德海 《职业技术教育》 2014年第7期 10500字

19824587 职业院校农民工职业教育模式比较 房风文 《中国职业技术教育》 2014年第9期 8200字

19824588 成人远程学习者自主学习影响因素分析 赵宏 《中国远程教育》 2014年第5期 9500字

19824589 退役士兵职业教育和技能培训情况实证研究 丁耀 《职业技术教育》 2014年第7期 10500字

19824590 城镇化进程中发展县域社区学院的现实基础及建议 刘凤翠 宁永红 《职教论坛》 2014年第7期 10100字

19824591 终身学习视角下我国社区学院定位研究 刘春朝 李建春 《职业技术教育》 2014年第7期 8800字

19824592 高职院校毕业生就业质量调查体系的建立与思考 王秋梅 罗清萍 江辉 《职业技术教育》 2014年第8期 6800字

19824593 远程学习者元认知、自我效能感对学业成绩的影响路径研究 苏琪 《职业技术教育》 2014年第7期 10600字

19824594 在线学习行为分析建模及挖掘 胡艺龄 顾小清 赵春 《开放教育研究》 2014年第2期 21100字

19824595 农远工程网络的教师学习模式研究述评 朱春俐 《继续教育研究》 2014年第3期 6100字

19824596 高职院校责任文化品牌制度保障体系创新 孙晓庆 《职教通讯》 2014年第8期 5200字

19824597 高职生职业人格特征的调查与分析 胡维芳 蒋超 《职业技术教育》 2014年第8期 8600字

19824598 近三十年来杜威职业教育思想研究述评 康红芹 庞学光 《职教通讯》 2014年第7期 12300字

19824599 北洋政府时期职业教育概览 刘金 《职业教育研究》 2014年第3期 10100字

19824600 韩国职业教育的一体化特色 蒋家响 《职教论坛》 2014年第7期 6100字

19824601 英国现代学徒制及其在我国的实施策略 范心忆 《职教通讯》 2014年第7期 7000字

19824602 澳大利亚就业技能新框架的创新与核心要素――基于新框架第一阶段报告的分析 李运萍 《职业技术教育》 2014年第7期 8800字

19824603 澳大利亚技能培训体系对我国高职院校发展方向的启示 吉文林 《江苏高教》 2014年第2期 5800字

19824604 中德职业教育课程与教学机制的比较 陈东 《教育与职业》 2014年第7期 5300字

19824605 德国职业教育师资队伍建设对广东技工教育的启示 陈旭彬 《职业教育研究》 2014年第3期 13400字

19824606 世界学习型城市建设的风向标 黄健 《世界教育信息》 2014年第6期 12100字

19824607 德国职业“关键能力”的内涵及培养途径研究 王婀娜 吴全全 《中国职业技术教育》 2014年第9期 6600字

19824608 美国学业质量评价的新视点:中间性评价的产生、应用及发展 王萍 傅泽禄 《比较教育研究》 2014年第3期 10100字

全文检索篇7

19825220 打造特色专业集群 助力新建地方本科院校转型发展 崔勇 《中国高等教育》 2015年第6期 5000字

19825221 我国职业教育政策研究热点的领域构成与拓展趋势 于海燕 祁占勇 《教育与职业》 2015年第7期 13200字

19825222 我国职业教育发展:现状、问题与方略 韩永强 《职业技术教育》 2015年第7期 10500字

19825223 积极职业教育构想及其主要内容与实施途径 姜飞月 《职教论坛》 2015年第8期 9800字

19825224 职业价值观教育论纲――基于高等职业技术教育视角 张艳芳 《职教通讯》 2015年第7期 7100字

19825225 产出导向的职业教育质量监控――职业院校的职业能力测评案例 赵志群 等 《中国职业技术教育》 2015年第9期 13100字

19825226 辽宁省职业教育与区域经济协调发展研究 赵迪 等 《职业教育研究》 2015年第3期 8600字

19825227 各地建立职业教育经费保障机制的实践探索 徐静茹 马树超 《职教论坛》 2015年第7期 12100字

19825228 地市高职院校服务新型城镇化人才培养的现状与对策――基于全国585所地市高职院校的调查 金雁 吴建设 《中国高教研究》 2015年第3期 15200字

19825229 高职院校教学规划编制的逻辑考量 王晓华 《清华大学教育研究》 2015年第2期 8700字

19825230 职业教育与新型工业化过程中的劳动力资源优化配置 张原 《职业技术教育》 2015年第7期 15800字

19825231 新型城镇化进程中农村转移劳动力职业培训价值感知驱动因素研究 郑爱翔 《教育发展研究》 2015年第5期 12100字

19825232 高等职业教育实施现代学徒制的瓶颈与对策 杜启平 熊霞 《高教探索》 2015年第3期 7400字

19825233 关于优化高等职业教育专业布局的理性思考 杨振军 《江苏高教》 2015年第2期 7800字

19825234 皖江城市带高职院校教学资源跨校整合优化研究 孙晓峰 王似保 《中国高教研究》 2015年第3期 10100字

19825235 论高职院校“双师型”教师的社会服务能力 蔡玉俊 等 《职业技术教育》 2015年第7期 8800字

19825236 高职院校教师教学发展中心建设的经验借鉴与实践探索 步雅芸 金雁 《高等教育研究》 2015年第3期 7600字

19825237 农村职业教育概念辨析 翟洪江 等 《教育与职业》 2015年第8期 10500字

19825238 我国农民教育发展的动力与向度――基于人口学的视角 杨智 《职业技术教育》 2015年第7期 8800字

19825239 我国成人教育体系的体制现状分析与改革构想 李春美 《江苏高教》 2015年第2期 6000字

19825240 农村新型社区成人学习策略――基于建构主义学习观 侯龙真 《职教通讯》 2015年第7期 7100字

19825241 高等职业技术师范院校教育实习全程化设计 谢良材 张维佳 《职业技术教育》 2015年第8期 8800字

19825242 高职毕业生毕业一年期内离职次数及其影响因素研究――基于多项Logistic回归分析 冉云芳 《教育发展研究》 2015年第5期 8600字

19825243 1906~1917年美国职业教育运动学术史 张斌贤 高玲 《大学教育科学》 2015年第2期 20200字

19825244 美国、欧盟职业教育评估的取向与特征评析――以评估体制与指标为基础 王永林 《高等教育研究》 2015年第3期 17500字

19825245 近三十年来黄炎培职业教育思想研究述评 喻忠恩 《职教论坛》 2015年第9期 12100字

19825246 国内外区域职业教育一体化对京津冀的启示 闫志利 王伟哲 《教育与职业》 2015年第8期 10200字

19825247 美国社区学院学生参与度调查方法与启示 吴智泉 等 《职业技术教育》 2015年第7期 10500字

19825248 从美国就业指导模式看我国高校职业教育发展 姚三军 《国家教育行政学院学报》 2015年第3期 6700字

19825249 本位化:马来西亚终身学习战略推展研究 欧阳忠明 雷青 《中国职业技术教育》 2015年第9期 10800字

19825250 可持续发展教育的全球走势与中国特色 王巧玲 《世界教育信息》 2015年第5期 6000字

全文检索篇8

【关键词】信息;信息检索;检索工文献检索

20世纪以来,人类创生的信息量高速增长,浩如烟波。如何从这海量的信息里找出所需信息就成为信息检索的重任。

伴随着计算机进入多媒体时代,信息科技也步入了多媒体发展时期。手工检索靠手翻、眼看、大脑判断的检索方式已难以全面适应当今信息的发展,计算机信息检索必然的提到了应用与发展阶段,以Internet为代表的全球化、网络的实际应用更进一步推动了这一发展,这既是对手工检索的扩展,也是时代的需要。在当今资本资源和数字资源并存的信息时代,作为信息资源管理者,既需要了解和掌握传统手工检索的方法,也需要熟悉和掌握计算机检索,尤其是网络信息检索的理论和技术,这是信息时代对图书馆工作者信息素质的必然要求。

一、信息检索的起源和发展过程

信息检索源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶开始发展,至20世纪40年代,索引和检索已成为图书馆独立工具和用户服务项目。随着1946年世界上第一台计算机的问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来,脱机批量情报检索系统、联机实时情报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各个领域高速发展,得到了广泛利用。Dialog国际联机情报检索系统是这一时期的情报检索领域的代表,至今仍是世界上最著名的系统之一。

(一)手工检索阶段(1876—1954)

信息检索源于参考咨询和文摘索引工作。较正式的参考咨询工作是由美国公共图书馆和大专院校图书馆于19世纪下半叶发展起来的。到20世纪40年代,咨询工作的内容又进一步,包括事实性咨询、编目书目、文摘、进行专题文献检索,提供文献代译。“检索”从此成为一项独立的用户服务工作,并逐渐从单纯的经验工作向科学化方向发展。

(二)脱机批量处理检索阶段

1954年,美国海军机械试验中心使用IBM701型机,初步建成了计算机情报检索系统,这也预示着以计算机检索系统为代表的信息检索自动化时代的到来。

单纯的手工检索和机械检索都或多或少显露出各自的缺点,因此极有必要发展一种新型的信息检索方式。

(三)联机检索阶段(1965年—1991)

1965年美国系统发展公司研制成功ORBIT联机情报检索软件,开始了联机情报检索系统阶段。与此同时,美国洛克公司研制成功了著名的Dialog检索系统。20世纪70年代卫星通信技术、微型计算机以及数据库产生的同步发展,使用户得以冲破时间和空间的障碍,实现了国际联机检索。计算机检索技术从脱机阶段进机信息检索时期。远程实时检索多种数据库是联机检索的主要优点。联机检索是计算机、信息处理技术和现代通信技术三者的有机结合。

(四)网络化联机检索阶段(1991年至今)

20世纪90年代是联机检索发展进步的一个重要转折时期。随着互联网的迅速发展及超文本技术的出现,基于客户/服务器的检索软件的开发,实现了将原来的主机系统转移到服务器上,使客户/服务器联机检索模式开始取代以往的终端/主机结构,联机检索进入了一个崭新的时期。

二、信息检索系统类型

(一)参考数据库检索系统

参考数据库检索系统以二次文献数据库为主,提供文献的题录、文摘数据或事实数据

(二)全文数据库检索系统

全文数据库检索系统是近年来随着数字化技术不断成熟而发展起来的,系统能提供文献的全文数据,包括图表、图像等多种形式的媒体。

(三)Internet网络检索工具

Internet搜索引擎主要提供网上资源的链接,某些搜索引擎也提供简单的网页介绍或检索词的上下文。

三、信息检索方式

(一)命令检索方式

命令检索方式指的是检索过程中,每一项检索提问,必须通过具体的命令来完成,这些检索命令通常需要用户熟记。这种方式虽然对于初级用户来说比较麻烦,需要记很多的命令,但是对熟悉系统的用户来说,命令方式有其步骤简单的优点,尤其是完成一些复杂的检索算法时,操作步骤简单。许多国际联机检索系统,在推出新的检索方法的同时,仍保留着原有的命令检索方式,为喜欢命令检索的用户提供服务,Dialog系统就提供了比较多的检索命令。

(二)单检索方式

这种检索方式实际上是将各种检索指令转化成菜单选项,系统的功能和检索指令通过菜单和子菜单的选项来实现,用户通过菜单一目了然,只需根据需要在菜单上选择某一项,或进行检索,或显示命令中的纪录等。菜单驱动的检索方式对初级用户是比较友好的,用户不需要培训就可以自行检索,很容易入门,但对于较复杂的检索算法,常常需要进入层层(下转第182页)(上接第180页)菜单才能完成。

(三)命令与菜单相结合的方式

这种检索方式既保留了指令检索的方式,又提供了菜单的某些直观的功能。对于复杂的检索方法,主要以命令的方式来组织,而一些常用的命令或参数可以通过菜单选项来选择,这样,简化了完全依赖于指令方式的检索步骤,可以让用户减少指令和参数的记忆量。目前有些联机检索系统在WEB上推出了这样的检索方式。

四、信息检索技术

(一)布尔逻辑检索技术

布尔逻辑检索技术就是指利用布尔逻辑运算符进行检索词语和代码之间的逻辑组配运算,从而获得检索结果的一种检索方法。这是计算机信息检索中最基本的也是最常用的技术。

1.逻辑“与”(AND)。逻辑“与”组配是具有概念交叉关系和限定关系的一种组配。通常用“AND”或“*”作为算符表示。

2.逻辑“或”(OR)。逻辑“或”是并列概念关系的一种组配,通常用运算符“OR”或“+”表示。

3.逻辑“非”(NOT)。逻辑“非”组配是指不包含某种概念关系的一种组配,它可以从原检索范围中排除一部分文献纪录,逻辑“非”的运算通常用“NOT”或“—”作为运算符。

(二)截词检索技术

截词检索(Truncation)是一种常用的检索技术,特别是在西文检索中,更是广泛使用。截词检索就是对词的片断进行比较,检索者将检索词在合适的地方截断,然后将截出的片断进行检索。

(三)字段限制检索

在检索系统中,为了提高检索的准确率,缩小检索的范围,通常用一些限制的手段和方法。使用这些方法进行检索通常称为限制检索(LimitSearch)。常用的限制方法就是字段限定。

(四)全文本检索技术

全文本检索技术(FulltextSearching)是对数据库纪录的全文文本检索,即纪录中的每个词都可以作为检索入口,且可以限定词与词之间的语义关系。全文本检索也有人把它称为自由文本检索。

五、结语

随着信息技术的进一步发展,信息检索技术必将更加完善,它将在人类与信息之间建起一座方便的桥梁。

参考文献

[1]李满潮.VisualC#?NET高级编程[M].北京:清华大学出版社,2002,(231–235).

[2]付磊.ASP1net编程实作教程[M].北京:北京希望电子大学出版社,2002,(151–158).

[3]廖信彦.ASP1net交互式Web数据库程序设计[M].北京:中国铁道出版社,2003(102–120).

[4]徐雅斌,王秀敏,刘鸿沈.基于1NET平台的三层结构应用系统开发[J].辽宁工程技术大学学报,2005,(2).

上一篇:检索策略范文 下一篇:检索工具范文