利用GATE的XML配置文件实现病历短语抽取的机器学习方法

来源 :中国医疗设备 | 被引量 : 0次 | 上传用户:just1015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文利用文本工程通用框架软件的XML配置文件,来指定所学文档使用的特征参数、学习算法,实现文本病历医学短语抽取的机器学习。结果计算机能很方便的在大段病程资料中快速自动获取医生所需的医学短语信息。本学习算法具有较好的实用性,达到了预期要求。
其他文献
<正>去年以来,在两岸文坛,有两首诗常常被人提及,并经常被放在一起鉴赏比较,这就是台湾著名诗人余光中的《乡愁》和祖国大陆著名铜雕艺术家朱炳仁的《云彩》。余光中先生作为
针对3维人脸识别问题,提出一种由粗到细的两步识别方法。首先结合几何约束与曲率信息定位特征点,根据特征点确定人脸对称面,提取人脸侧面轮廓线。利用轮廓线匹配作为排除算法
<正>脂肪肝是目前中、老年常见的肝脏疾病。近年来脂肪肝有呈现出年轻化的趋势。高校大学生超重和肥胖学生比例正逐年上升。数据显示,去年我省高校新生正常体重学生比例仅为5
<正>胶质瘤为起源于神经胶质细胞的肿瘤,呈浸润性生长,与周围组织无明显分界,目前采用手术、放疗、化疗等措施疗效不十分理想,五年生存率仅为35%~50%[1]。手术全切率低和术后
本研究以少管所、工读学校和普通中学的740名青少年为被试,采用问卷法考察了家庭环境、父母监控与青少年违法犯罪行为的关系。根据自我报告的违法犯罪行为得分,将青少年分为3
目的 探讨交通事故意外伤害的高危人群,高危车种和高发时间,以揭示车祸发生的危险因素。方法 用流行病学原理对番禺市1997年发生的4 752宗交通事故(车祸)伤害进行回顾分析。结果 全年
<正>新材料产业是我国材料工业发展的先导,是7大战略性新兴产业发展的基础和保障。当前,我国新材料产业处于"黄金发展"前期,在产业体系、产业规模、技术水平和发展机制等方面
习语作为一种蕴含深厚文化内涵的短小精悍的语言为中西方人民所钟爱,然而这些丰富多彩的习语是中西方人民在长期使用语言的过程中创造出来的,有其浓厚的民族和历史色彩。本文
目的:探讨不同剂量长波紫外线(UVA)照射对线粒体DNA缺失细胞系细胞自噬的影响。方法:通过不同剂量(0、4、8、12 J/cm~2)长波紫外线(UVA)连续3 d对来自骨肉瘤细胞的两种细胞系