面向互联网资源的医学命名实体识别研究

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:xjfox1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医学信息提取的第一步在于命名实体识别,然而公开医学语料的缺乏使得这项工作困难重重。已有的研究大都建立在少量人工标注的文本之上,不具备很好的推广性。互联网作为大量数据的聚集地,可以从中进行医学知识的提取。针对互联网资源规模大,结构化程度低,缺乏标注等特点,提出了一种迭代式框架来对其加以利用。使用融合通用模型和领域词典的方法对文本进行标注,缓解了领域不同带来的精度降低问题。使用在线方法来构建模型,避免了迭代中对模型进行整体重构。在命名实体识别模型中融入了词法特征、词缀特征、词长特征等,提高了模型的识别能力。提
其他文献
EAM的应用与实施在发电企业进行得如火如荼,但在供电企业却少有实施或应用.一方面是由于发电与供电的专业特点和市场环境有所不同;另一方面,如何本着以流程为本的思想,理清和
非结构网格应用软件编程框架JAUMIN(Jadaptiveunstructuredmeshapplicationsinfrastructure)支撑了多个千万亿次并行应用软件的快速研发,并已成功应用于重大科学装置结构力学分