试论全文检索引擎技术在电子病历中的应用

来源 :科技创新导报 | 被引量 : 0次 | 上传用户：daiguangying

【摘要】

：

【作者】

：

刘怡

【出处】

：

科技创新导报

【发表日期】

：

2019年5期

【关键词】

：

全文检索引擎技术电子病历数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：全文检索引擎技术是指利用计算机程序，将文章中所有词组建立与之相对应的索引，用户进行查询时，可以根据索引将查找结果快速传递给用户的检索方式。本文结合全文检索引擎技术的基本步骤，通过对Lucene技术、Ajax技术、Struts技术在电子病历中的应用研究，以提高临床数据的利用效率。
　　关键词：全文检索引擎技术电子病历数据
　　中图分类号：G354.49 文献标识码：A 文章编号：1674-098X（2019）02（b）-0138-02
　　电子病历是将病人所有的医疗记录（包括纸张病历）通过电子设备进行存储、管理、传输的系统。传统电子病历存储方式相对分散，并且很多信息不能作为检索条件，降低了医疗数据的利用效率。全文检索引擎技术可以将病历信息进行统一转换，使检索信息更加全面，为病历管理工作提供更加便捷的服务。
　　1 全文检索引擎技术的基本步骤
　　1.1 数据采集
　　数据采集是将准备加载到数据库中的相关数据进行收集，并按照标准进行数据分类，为数据预处理做准备[1]。所加载的数据可以通过多种途径获得，就电子病历而言，常见的数据来源有：人工录入建库、电脑生成的文件、图文处理后得到的文件、计算机上传的文件等。
　　1.2 数据预处理
　　数据来源的不同造成获得数据格式的多种多样，对此需要对数据进行格式规范化处理，方便数据检索;在规范数据格式后，进行文本的预处理，将文本中的词组进行批式标引，使其在检索时不会受到数据库结构的影响，提高检索效率;在进行批示标引后，对文本中数据添加属性标引，使数据分类更加清晰。
　　1.3 数据库建立
　　将整理好的数据通过拷贝、输入等方式加载至数据库中。数据库建立的过程中，可以选择单篇加载或批量加载两种方式。单篇加载与文献上传方式类似，一次只加载一篇文章;批量方式可以单次加载多篇，适用于数据数量较多，需要集中加载的情况。
　　1.4 数据检索和维护
　　数据库在建立之后，用户可以利用系统的检索功能对数据库中数据进行检索，通过关键词搜索获得所需的重要信息。数据库在建立之后需要对数据内容进行不定时更新，添加新的属性标引或数据信息。
　　2 全文检索引擎技术在电子病历中的应用
　　2.1 Lucene技术
　　2.1.1 Lucene的组成结构
　　第一，语言分析器。由org.apache.lucene.analysis语言分析包构成，主要用于抽象类切词Analyzer的管理，按照切分词规则进行数据库中文本内容类别的划分;第二，文档存储管理结构。由org.apache.lucene.document数据包构成，该数据包类别较少，主要用于Field信息的储存。Document属于Field的子机构，是为了方便存储Field相关数据而构建的管理结构;第三，数据索引管理结构。由org.apache.lucene.index索引包构成，主要负责索引信息的建立和删除。索引管理结构属于Lucene检索系统的核心组成，用户在检索时，不需要了解所有正文内容，只需要了解基本索引信息就可以完成检索，提升了检索效率[2]。第四，数据查询分析结构。由org.apache.lucene.queryParser数据包组成，用户在进行检索时，该结构对用户所提供的关键词进行词组间信息关系判定，执行与、或、非等相关判定;第五，检索管理结构。由org.apache.lucene.search包组成，根据数据查询分析结构所提供的分析结果，检索管理结构进行数据库中对应属性文章的匹配，并在检索结果处进行展示;第六，存储管理结构。由org.apache.lucene.store组成，在完成一次检索之后，该结构对检索结果进行存储管理，不定时进行数据库数据补充，使数据库数据信息更加全面。
　　2.1.2 Lucene在电子病历中的实际应用
　　首先，建立索引机制。Lucene将电子病历中的所有内容添加到数据库中，将文本中内容进行定义和划分，使其能够划分成多个字段;在组建过程中，需要對划分好的多字段文本进行切词处理，处理规则参照org.apache.lucene.analysis语言分析包规则进行;将切分后的词组添加到索引机制当中，方便查询时使用。其关键代码如下：IndexWriterwriter=newIndexWriter（通过索引机制建立新的检索机制）;FileInputStreamis=newFileInputStream（确定Document对象）;writer.addDocument（doc）（将文本内容写入索引机制）。
　　其次，用户进行检索。用户在进行电子病历查询时，确定查询条件，并通过运算分析词组间关系。如用户需要查询“肾脏”和“泌尿系统”相关的记录，可以输入“肾脏、泌尿系统”来进行查询。分析器在接到关键词时，对词组进行切词处理，并判定两者存在“与”的关系，核心系统得到的查询条件为“肾脏”与“泌尿系统”。根据此条件进行索引机制中相关内容的查询。
　　最后，用户得到检索结果。关键词在索引机制查询过程中，利用contents字段进行数据库内容搜索，所有的搜索结果利用path字段进行输出，实现信息的快速检索。
　　2.2 Ajax技术
　　2.2.1 Ajax技术的工作原理　　Ajax（Asynchronous JavascriptAndXML）是借助交互式网络应用的异步通信技术[3]。用户在进行检索时，Ajax技术类似于在客户端与服务器中添加了中间环节，使服务器响应时间与用户操作时间异步化。对于部分用户请求，Ajax可以利用自身系统进行解决，减少用户等待时间。如果出现新问题，Ajax会代替用户向服务器提交申请，提高用户体验度。
　　2.2.2 Ajax技术在电子病历中的应用
　　第一，建立XML Http Request。利用Internet Explorer 将目标对象ActiveX对象进行引入，以此构建XML Http。受到不同Internet Explorer的影响，为了实现多版本浏览器中XML Http的兼容性，需要仔细分析不同XML Http特性，创建XML Http Request类。使用户在进行检索时，不会受到XML Http影响造成检索失败。而创建XML Http Request类的主要代码如下：xmlhttp--request = new XML Http Request（）。
　　第二，根据检索内容编写响应函数。服务器在接受到用户请求时，Http需要明确用户请求需要使用哪种类型Java Script响应函数进行处理。在实际操作过程中，可以将待处理对象属性进行分类，并把待处理对象的on ready stste change标记成Java Script响应函数的名称，使请求能够得到准确处理。
　　第三，将目标对象请求进行发送。在定义目标对象请求处理方式之后，采用Http中open（）与send（）两种请求类方法进行服务器请求。
　　第四，服务器接收到服务请求后，相应函数开始进行数据处理分析，在处理过程中，函数会检查Http服务器此时相应的状态值，在确定其处于正常工作状态后，进行处理后数据的显示。
　　2.3 Struts技术
　　2.3.1 Struts技术工作原理
　　Struts技术是借助Sun J2EE平台所构成的Model-View-Controller（模型-视图-控制器）框架。Struts技术在使用过程中通过Servlet 和JSP技术进行数据分析，并将分析结果利用平台进行呈现，以此实现电子病历相关信息的快速检索。
　　2.3.2 Struts技术在电子病历中的应用
　　第一，构建Struts Web目录。根据电子病历数据库类型进行目录路径构建。如WEB-INF 、classes等;第二，数据填充。将电子病历中所有的数据和Struts 各个API库中的文件考入既定的Web程序当中。对于Struts 中已经标注的文件，将数据信息拷贝至指定路径当中，提高数据库中数据信息总量;第三，编写源文件。将数据库中的信息进行编写，筛选出提示错误的信息，将现有信息进行规范化处理，利用MVC框架将规范化的信息进行匹配;第四，处理请求信息。Struts在接收到用戶请求时，利用数据分析原则进行切词，将其划分为不同单元（最小为两个字节），并且利用函数对处理后词组关系进行判定;第五，处理请求。在接收到Struts处理的数据请求后，根据相关规则，进行数据信息匹配，使用户得到想要的数据信息。其主要运行代码为：<html：form action=”/bpl”>和<bean：define name=”bplAForm” property=”bplBForm” id=”bpl B”。在此运行过程中，Struts进行<bean：de-fine/>标记，在出现信息请求时，所标记程序开始在系统内部工作，得到由Action Form系统拓展形成的BPLAForm，并在输出之前校验BPLAForm信息的准确性。利用Struts技术可以加快电子病历数据库建立速度，并且Struts提供了基本的构建模型，只需要根据模型进行数据补充，可以在较短时间内完成数据库建立，使代码的重复使用率提高，有效减少数据库的维护费用。
　　3 结语
　　综上所述，Lucene技术可以提高信息检索速度，Ajax技术可以进行数据检索分流，提高用户体验度，Struts技术可以加快数据库构建速度，减少维护费用。将全文检索引擎技术应用在电子病历中，对于提高检索速度、提升信息获取精确度有着重要意义。
　　参考文献
　　[1] 鲁曦.基于Lucene的购物网站商品全文检索功能的设计与实现[D].北京工业大学，2018.
　　[2] 赵景越，徐松青，蔡连忠.全文检索引擎技术在电子病历中的应用[J].数字技术与应用，2018（12）：89-90.
　　[3] 徐财应.基于Lucene的搜索引擎技术的研究与改进[D].长春理工大学，2018.

其他文献

UPS电源设备维护及蓄电池充电电路解析

摘要：UPS主要就是在計算机以及网络系统中应用，其主要的作用就是为电子设备提供不间断的交流电力，保障其稳定运行。UPS电源设备维护以及蓄电池充电电路是较为关键的内容，了解电源设备维护要点，解析蓄电池充电电路可以为UPS的稳定应用提供参考。基于此，主要对UPS电源设备维护及蓄电池充电电路进行了简单的分析论述。　　关键词：UPS电源设备维护蓄电池充电电路解析　　中图分类号：TN86；TM91

期刊

UPS电源设备维护蓄电池充电电路解析

自体角膜缘干细胞移植术治疗翼状胬肉疗效观察

目的：探讨自体角膜缘干细胞移植术治疗翼状胬肉的临床疗效.方法：选取84例（98眼）翼状胬肉患者,随机分为A、B 2组.A组42例（50眼）予以常规单纯翼状胬肉切除术治疗,B组42例（48眼）予以翼状

期刊

翼状胬肉自体角膜缘干细胞移植术复发率pterygiumthe corneal limbal stem cells autograft transplan

超市收取条码入场费是否合理

期刊

商品条码超市入场费收取条码入场费供货商

舰载天线力学计算方法分析

舰载天线在使用过程中会经常受到风荷、冲击、振动等载荷影响,因此对该类天线进行力学计算,以保证天线的结构安全、可靠性尤为重要。本文针对舰载天线使用环境的特殊性,以舰

期刊

舰载天线摇摆受力抗风校核

亚甲基四氢叶酸还原酶基因多态性与2型糖尿病的相关性

目的：探讨亚甲基四氢叶酸还原酶（MTHFR）基因C677T和A1298C多态性与2型糖尿病（T2DM）的关系。方法：选取106例T2DM患者（病例组）和109名健康对照个体（对照组），采用聚合酶链反应一限制性片段

期刊

糖尿病2型亚甲基四氢叶酸还原酶基因多态性diabetes mellitus type 2 methylenetetrahydrofolate re

简析弹簧管式压力表的计量检测问题与对策

随着时代的进步、科学技术的不断发展,各个行业也得到了很快的发展,而化工、冶金等领域也得到了快速的发展,但是随着快速的发展,许多的问题也逐渐暴露出来,这些领域都广泛地

期刊

弹簧管式压力表计量检测问题对策

基于单目标优化的机械传动减速器设计研究

摘要：随着数控技术与计算机技术的发展，目前我国在机械加工效率与精度方面都获得了很大提高，进一步推动了机械传动的产品多样化。整机的模块化，标准化和艺术设计使产品更加精致美观。针对减速机存在的问题，本研究采用优化设计的方法，通过建立数学模型，力求减小减速机的体积。最终经本文优化算法获得一组优化数据并实现期望的目标，与常规经验设计结果相比将减速器的体积减小20%。　　关键词：减速器体积优化机械传动

期刊

减速器体积优化机械传动单目标优化

新型马桶纸垫产品及加工设备设计探讨

期刊

马桶纸垫加工设备设计成型原理全自动设备

新型CBC^TM起皱刮刀装置

期刊

新型CBC^TM起皱刮刀装置纸机性能调节起皱角经济效益使用

彩色皱纹纸的加工工艺与设备

期刊

彩色皱纹纸加工工艺设备加工原理

试论全文检索引擎技术在电子病历中的应用

与本文相关的学术论文