医学文献检索中检索词的选择

时间:2022-06-12 08:03:29

医学文献检索中检索词的选择

摘要:目的 在文献的检索过程中,通常使用主题词或者自由词等进行检索,本节就检索词的有效选择进行探讨。方法 对检索过程汇总所用到的两种"词",包括:主题词以及自由词两种,的区别进行分析;针对两种选此,利用实例法对其检索的效果和结果进行探讨,检索在Medline和CBM数据库中进行。结果 在Medline数据库中,以主题词的方式进行检索,其文献结果明显的好于自由词的检索方式;在CBM 数据库中,以主题词的方式进行检索,文献检索效果较好,但对于最新的文献,自由词的检索方式的作用更好。结论 由于检索系统存在的技术问题及文献标引问题,在检索过程中,主题词检索方式和自由词检索方式的检索过程都有着各自的优缺点。因此,采用主题词和自由词联合的方法达到最佳的检索效果。

关键词:文献检索;主题词;自由词;Medline和CBM数据库

在信息高度发达的今天,人们可以通过信息检索的方式来获得所需要的资料。信息检索在当前检索的方式和性质来看主要课分为三类。其中,学术文献的检索和信息数据的检索是检索中最主要的两个方面,此外还有事实的检索。在学术文献的检索过程中,检索的语言决定这检索的过程和方法。比较常用的两种语言检索方式为主题词检索法以及自由词检索法。本文首先对主题词检索法以及自由词检索法进行了分析,并在此基础上以实例对两种方式的效果进行了探讨。

1主题词检索方式

主题词在文献检索中也被称作叙词和受控词两种,"词语"在选择时有明确的规定,以达到"词语"和检索中概念具有很好的吻合度。美国NLM制定了当前通用的主题词表-MeSH。MeSH中的主题词,是由NLM职员在对各种文献进行统计分类并将其主题进行标引来制定的。主要用做对文献进行规范话处理。MeSH在当前的医学文献检索过程中是最常用的一种方式。MeSH 的这种对文献内容进行标引和揭示的特点,应用于文献检索过程中,能有效的提升检索的准确性和快速性。在文献检索的过程中,还有着副主题词以及特征词,这两者对于文献检索的范围以及准确率都有很好的帮助。比如:我们在查找" APC和MCC的DNA缺失在胃癌临床生物学中的作用"时,可就下列主题词进行文献的搜索,包括:APC、MCC、DNA缺失、胃癌以及基因等主题词。检索中的特征词可定义为人类。当然也可以就物种、雌雄、文献性质等进行限定。特征词和限定词在检索的过程中,都是对检索的内容进行选择和限定,已达到提升检索的准确率的目的。

2自由词检索方式

自由词检索方式也常被称作关键词检索法,该方式是基于电脑编制索引目的出现的。文献检索中的关键词,通常是说那些在文献的题目、摘要以及全文中,对文献的内容进行概括性表达的词语。比如:文献"癌DNA以及抑癌DNA在大肠癌临床研究中的现状和展望"中,"癌DNA"、"抑癌DNA"、"大肠癌"这三个词可以从整体上对该文献进行诠释,因此,能够作为关键词进行使用。而"研究"、"现状"、"展望"是对该文献的辅描述,无法被当做检索入口使用,所以不能被用做关键词。关键词在形式上没有特定的规范,通常出现和存在于文献的摘要中。当前,基本上全部的期刊文献都对文中的摘要进行了要求。所以,从这一点来看,从摘要中以关键词来进行文献的建设,其检索的全面性比仅从主体中进行检测要全面。此外,相比于从全文内容进行检索的方式,关键词检索的速度较快且失误率低。在关键词检索过程中,要注意词及其符号间的改写,比如:α也可被写为Alpha。

3实例1及分析

以实例对两种检测方式的效果进行分析。在CBM数据库中检索"手术方式临床对原发性肝癌的价值"。采用主题词方式进行检索:主题词为肝肿瘤和外科学,检索到文献有8610篇;采用关键词方式进行检索:关键词为原发性肝癌以及手术,共检索到文献3571篇。由此结果可以看到,检索中以关键词方式进行检索,会造成大量文献漏检的状况。这主要是在一些文献中,会以"肝癌"或者其他概念来代替"原发性肝癌",这也造成了这种方式检索的查全率较低的状况。此外,在关键词的检索方式中,存在着一发生重大误检的状况。比如上述的关键词检索就检索到了"药物化疗方式在临床治疗原发性肝癌的价值"以及"AFU 联合AFP在原发性肝癌检测及诊断中的价值分析"等完全没有任何联系的一些文献。

4实例2及分析

在数据库中对课题"HP 感染胃癌易感基因多态性检测芯片的研发和应用"进行检索。该课题的研究内容主要是对IL-1B, IL-10, TNF-α等的多态性进行研究,并进行基因芯片的检测,以此对HP感染的胃癌患者进行筛查。在检索的过程中应从下述方式进行。

首先,以主题词方式和关键词方式在国内数据库中进行检索。其中,主题词检索方式中,主题词为胃肿瘤;副主题词包括:幽门菌,DNA,基因片段、生物芯片、白介素、肿瘤坏死等。关键词检索方式中,关键词为:胃癌;幽门菌(Hp);基因芯片;白介素;肿瘤坏死因子。

对于国内文献的检索,通常是在CBM 数据库中进行。对于"基因芯片"这种全新的概念,数据库中还未进行标引。因此,在进行该类文献的检索过程汇总,通常仅以相近、类似或上一级的主题词来代替进行检索。该研究题目的检索中,可以DNA, 互补; 基因序列以及基因表达等作为相应的主题词进行检索。从检索的结果看,虽然能检索的一些相应的关于基因芯片方面的研究文献,但是也存在着严重的漏检状况。而采用关键词的方式进行检索,就能够获得较好的检索结果。该检索的对比结果表明,对于非前沿的研究,主题词方式的检索得到的文献远比关键词式的检索结果。但对于前沿的研究或者全新的领域,在检索的过程中,采用关键词式的检索方式能得到较好的检索效果。

其次,以主题词方式和关键词方式在国外数据库中进行检索。检索的主题词:explode "stomach- neoplasms"/all subheadings; oligonucleotide- array- sequence- analysis; tumor- necrosis -factor; interleukin- 1; interleukin- 10; Helicobacter pylori。检索的关键词:Gastric cancer; gene chip; dna array; gene polymorphish;interleukin-1B(IL-1B);interleukin-10(IL-10);tumornecrosis-factor-α(TNF-α);H・pylori(HP)。

对于外文文献的检索,通常是在Medline 数据库中进行。对该课题相关内容:基因芯片进行检索。对于主题词检索方式,主题词为"oligonucleotide- array- sequence- analysis",经检索共得到24713篇文献;对于关键词检索方式,关键词为genechip和dna array,经检索共得到3691篇文献。所以,关键词的检索方式中,文献的概念及关键词间并不是相对应的,比如检索中的"基因芯片"在检索时,gene chip和dna array都可以对其进行表示。由此,采用关键词检索方式在检索的过程中就会发生漏检的现象,也就无法得到全部的文献。

5结论

综上,在文献的检索中,主题词检索方式以及关键词检索方式是当前两种最常用的检索方法,两种检索的方法各有优缺点,在具体检索的过程中,应依据检索的内容和深度来确定所采用的检索方法。并且最好选用一种检索方式作为主要方式,一种作为辅助检索方式。对于自己熟悉的领域以及内容,在检索时采用主题词检索方式能得到较好的效果;对于研究较为前沿的文献,或者专业词汇不明确的,采用关键词检索方式能得到较好的效果。

当前,相比与国内的数据库(CBM),国外数据库(Medline) 的检索状况更好,文献的主题词具有更新迅速以及标引规范的特点。而国内的数据库(CBM)中,主题词的更新则不快,标引也有待提高。因此,相比于CBM,在Medline中使用主题词方法进行检索,能够得到较好的检索结果。

总之,在检索的过程中,将两种检索方式进行联合使用能得到最佳的检索效果。

参考文献:

[1]邢春国,于双成.国外医学科技论文摘要的内容形式分析[J].中国医学文摘・外科学,2006, 25(2):190-192.

[2]霍仲厚,刘胡波.医药卫生科技查新教程[M].北京:军事医学科学出版社,2005:33-36.

[3]邢春国,徐桂香,田冬梅.医学文献检索中检索词的选择[J].现代情报,2007,27(1):136-137.

[4]叶晨,郑家伟,徐菱.如何利用自由词、主题词进行医学文献检索[J].上海口腔医学,2005,14 (3):306-310.

[5]董建成,周晓政.医学信息检索教程[M].南京:东南大学出版社,2002:4-5.

上一篇:CBS教学法在乳腺外科教学中的应用 下一篇:中职卫校示范校创建中临床教师队伍的建设