【摘 要】
:
生物医学命名实体识别是生物医学信息抽取的前提.目前实体识别大多采用机器学习的方法,依靠人工根据领域知识和经验制定特征,需要反复实验进行相应的特征选择,并且这些特征很
【机 构】
:
大连理工大学计算机科学与技术学院;
【基金项目】
:
国家自然科学基金项目(61173101;61173100)资助
论文部分内容阅读
生物医学命名实体识别是生物医学信息抽取的前提.目前实体识别大多采用机器学习的方法,依靠人工根据领域知识和经验制定特征,需要反复实验进行相应的特征选择,并且这些特征很少使用深层次的语义信息.为了探究语义信息对命名实体识别的影响,本文尝试在大规模未标注数据上进行训练,自动获得语义信息,得到三种词表示方法:词向量、基于词向量的聚类和布朗聚类.将其作为CRF和SVM的特征进行半监督学习,并在相同条件下进行对比实验.实验结果表明,词表示方法能有效地学习到潜在的语义信息,从而提高现有基于机器学习系统的性能.在未利用词典等任何外部资源的情况下,公共评测语料Bio Creative II GM上的实验结果为:精确率、召回率、F值分别达到91.24%、85.80%、88.44%.
其他文献
目的观察潮气呼吸肺功能检测在婴幼儿喘息治疗效果评价中的作用。方法 114例喘息患儿根据哮喘预测指数(API)分为API阴性组(64例)和API阳性组(50例),两均给予抗炎、抗过敏、舒
在媒体融合背景下,新闻文风也随之呈现出融合趋势。新闻在进入网络传播场域后,文风面貌发生改变。本文探讨了网络新闻文风的二元性特点,从真实与虚假、草根与低俗、创新与猎
公路工程项目的试验检测是工程企业保证施工质量的关键。针对公路工程项目试验检测管理中存在的不足,在正确认识公路试验检测管理对象和目标的基础上,建立了试验检测管理原则和
肾脏病理档案是患者医疗档案的一部分,主要是对蜡块、树脂块、染色切片、染色铜网、文字资料、电子资料、照片等大量实物、文字、电子数据资料的管理。计算机管理临床、病理资
对捕食线虫性真菌--少孢节丛孢菌(Arthrobotrys oligospora)菌株进行了临床杀家畜寄生性线虫幼虫作用的研究.结果表明:培养的少孢节丛孢菌分生孢子经口饲喂动物后,对粪便中线
长寿是现代高炉追求的目标,通过分析影响高炉长寿的斟素,阐述llr我国现代长寿高炉的设计思想以及高炉长寿装备的现状和发展趋势。
讨论了影响超薄铸带产品最终显微组织和力学性能,尤其是热加工工艺的主要参数,阐述了不同级别薄带钢的生产发展。
The main parameters affecting the final microstructure
邓晓芒的文学评论集《灵魂之旅——九十年代文学的生存境界》,深刻反思和批判了当代文学中的民族文化失语现象,从中传达出他对“语言是存在家园”这一现代哲学思想的创造性理解
医学高等教育以培养高级人才,将创造性实践能力培养作为终极目标,旨在培养合格的临床医生。随着科学技术更新,合格医学生的培养并不局限于理论知识以及临床技能的学习和掌握,
沙岭学校是位于北京市顺义区东部的一所乡村学校。一直以来,学校秉承"鼓舞"的育人理念,追求着"尊严、品质"的办学目标。为让这所具有百年历史的老校焕发出时代的生机,学校引进3D