论文部分内容阅读
目的 生物医学文献数据库是临床医学实践证据的重要来源之一。近年来,随着中文生物医学文献光盘数据库和网络数据库的发展,越来越多的临床医生能够自己上网或利用校园网检索文献。中国生物医学文献光盘数据库(CBM)、中国期刊网(CNKI)、维普信息资源的中文科技期刊数据库(以下简称维普信息资源)是临床医生检索中文医学文献最常用的数据库。在实际检索过程中,大部分医生深深体会到由于其检索策略不够完善,检索的结果往往并不令人满意,导致遗漏掉很多相关文献(低敏感度)以及检索到太多的不相关文献(低特异度)。尤其是在检索有关循证医学研究的证据方面的文献,由于涉及到研究的方法学问题,更增加了检索的难度。为了能够更有效地检索到研究方法合理、能为循证医学研究提供可靠证据的临床文献,Pubmed制定出了一套有关临床病因学研究、临床诊断学研究、临床治疗学研究和疾病的预后研究四方面文献的方法学检索过滤器,即Clinical Queries。该检索过滤器使用简单,并且能准确全面地检索出相关文献,因此深受临床医生的喜爱。目前,中文有关医学文献检索方法学的研究很少,这与我国期刊论文在科研设计及论文撰写等方面质量过低、中文文献数据库文摘质量、标引质量较差等诸多因素有关。本研究的目的有三:一是分别针对中文文献光盘数据库和网络数据库制定出在主题内容上属于病因学、诊断学、治疗学和预后四方面研究的临床文献的检索策略。本研究的目的之二是分别针对中文文献光盘数据库和网络数据库制定出符合循证医学研究方法学要求的,检索有关病因学、诊断学、治疗学和预后四方面研究的、能为循证医学研究提供可靠证据的文献的检索策略。目的之三是对中文文献检索的方法学进行研究,为同行提供借鉴。 实验材料和方法 本研究以手工区分期刊文献为金标准,选择31种2002年出版的中华医学会期刊和被IM收录的期刊上文献类型属于原始论著的文献,筛选出有关病因、诊断、治疗和预后四方面的循证医学方法学类文献和内容上属于上述四方面的文献。在C BM中套录这些文献,然后利用词频分析法统计出各类文献的高频文摘词、题目词、主题词和副主题词。以全部人选的期刊文献作为一个封闭的数据库,再计算出各类文献的高频词单独检索时的敏感度、特异度、精密度,选择敏感度x精密度高的高频词作为最终的检索用词。利用自编的计算机程序生成由全部检索用词(包括主题词、副主题词、题目词和文摘词)和由题目和文摘字段组成的检索词所组成的各种可能组合的检索策略,同时计算出各种组合策略的敏感度、特异度、精密度和NNR(nurnber needed to read)。其中由全部检索词组成的策略用于中文光盘数据库,而由题目和文摘字段组成的策略用于中文网络数据库,选择各组敏感度高和特异度高的策略作为最佳策略。结果 全部人选文献为2570篇,其中符合方法学要求的文献,病因学为10篇,诊断学为10篇,治疗学为45篇,预后为7篇,主题内容为病因学的文献为203篇,诊断学为287篇,治疗学为577篇,预后为81篇。侧重敏感度的各最终策略,其敏感度在0.%一1.00之间,特异度在0.49一0.90之间,NNR为2.7一n .7,也就是说这些策略能检索出全部相关文献的%%-100%,而科研人员如果利用这些策略,则最多每阅读11 .7篇文献就有一篇是相关的。侧重特异度的各最终策略而言,其特异度在0.93一0.99之间,精密度在0.24一0.71之间,敏感度在0.40一0.95之间,~在1;4一4.1之间,也就是说这些策略检索文献的查准率在0.24一0.71之间,而临床医生如果利用这些策略,则最多每阅读4.1篇文献就有一篇是相关的。结论 该方法适合于中文检索过滤器的制定,与国内外相关报道比较,本研究的结果可靠,提供的文献检索策略适用于中文检索型及全文型文献数据库。