临床医疗实体及其属性的联合抽取方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bingshanhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的迅猛发展使得临床医疗服务已进入数字化和信息化时代,一系列以电子病历为核心的医疗信息系统的建立与普及为医疗大数据奠定了坚实基础。在医疗大数据时代,如何分析利用医疗大数据,提高临床医疗服务智能化程度,成为当下临床医疗信息化亟需解决的问题之一。其中,临床医疗实体及其属性抽取是电子病历医疗信息挖掘的关键所在,是挖掘蕴含其中医疗知识的关键步骤。临床医疗实体及其属性抽取即识别医疗文本中的临床医疗实体和属性,并确定实体和属性之间的修饰关系,可以有效的将电子病历文本中隐藏着的丰富的医疗信息与知识结构化,为患者、医务人员和研究者们进行数据分析和挖掘提供基础,其广泛用于临床决策支持系统、个性化健康医疗信息服务和公共卫生服务等。传统上,临床医疗实体及其属性抽取任务采用基于管道方式的方法。这种方法使每个子任务变成一个独立的任务,简单易行,但忽略了这两个子任务之间的内在联系和依赖关系,且不可避免的造成了错误传播。而联合学习方法是使用单个统一的框架完成两个子任务,可以有效整合临床医疗实体与属性间的内在信息,通过正确的关系抽取提高“实体/属性”识别率。同时鉴于正确的修饰关系不可能从错误的临床医疗实体和属性中获得,提高实体和属性识别率也将提高实体和属性之间修饰关系的抽取性能。本文主要采用以下两种方式进行临床医疗实体及其属性联合抽取:1)串行联合方法:把临床医疗实体和属性识别当作序列标注问题,它们之间的修饰关系抽取当作分类问题;2)并行联合方法:把两个子任务一起当作序列标注问题。前者是采用一个端到端的神经网络框架通过共享两个子任务的参数对临床医疗实体及其属性联合抽取。本文在现有研究基础上提出两个新的串行联合深度学习方法,用于临床医疗实体及其属性抽取,通过引入临床医疗约束关系和偏置损失函数进一步改进这些方法。后者是通过设计新的问题表示将两个子任务转化成一个任务进行处理。本文提出采用BIOHD1234和Multi-Label两种方法进行临床医疗实体及其属性抽取的并行联合学习。为了评估提出的新方法,本文构造了一个中文电子病历数据集,并分别在中文数据集和英文SemEval-2015 Task 14公开语料上进行实验。实验结果表明本文所提出的新的联合学习方法比传统的基于管道方式的方法及Miwa等人[1]提出的联合学习方法在该任务上性能更佳,同时也验证了联合学习方法优于管道方法,串行联合学习方法优于并行联合学习方法。
其他文献
本研究以基于中国教师研修网的国培计划之“小学班主任教师培训项目”为个案,主要分析该项目当前的互动状况及互动深度,发现网络研修日志和沙龙文章的阅读点击率和评论的次数非
近年来,“联片教研”作为教育研究领域较热的一个话题,引发了诸多教育工作者的高度关注。本文立足教学实践,以“联片教研”这一教学热点为切入点,从概念阐述、积极价值、实施
随着企业分工更加精细化、网络信息化的迅速普及,单个企业之间的竞争逐渐被企业供应链之间的竞争所取代(Martin,1999)。无论从企业角度还是从外部监管者角度,供应链关系的发
处理好社区法官制度的适度性和侧重性,有利于缓解案多人少矛盾,创建无讼和谐社区。本文通过讨论社区法官制度的目的和初衷,对其功能进行了重新定位,认为社区法官制度通过延伸
定义了行准对称离散信道,给出了该种信道容量的计算方法,并举例说明了具体应用.
12月4日,中共中央召开党外人士座谈会,就"今年经济形势和明年经济工作"听取意见建议;12月6日,中央政治局会议召开,分析研究明年经济工作。和去年"面对错综复杂的国际环境和艰
2003年春夏之交,面对一场突如其来的非典,建筑行业和其他行业一样,在党中央国务院和各级政府的领导下,群策群力,戮力同心,赢得了抗击非典战役的阶段性胜利。但是,非典并未远
2019年9月,中共中央、国务院印发《交通强国建设纲要》,提出到本世纪中叶,全面建成“人民满意、保障有力、世界前列”的交通强国。建设交通强国是以习近平同志为核心的党中央立
报纸
在科学技术的带动下,推动了我国交通事业的发展进程,使得高铁行业得到了快速发展。高铁系统是一个比较复杂的工程,所应用到的技术比较多,视频监控系统是重要技术之一,有利于
新媒体的发展为大众信息的获取提供了更多的途径和方法,进而加速了信息的传播,信息的影响范围也不断扩大。新媒体的发展,导致娱乐圈中大量新闻的报道,这些新闻报道的传播为大