病理镜检文本数据的结构化处理方法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:my85643284
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前医疗文本数据的结构化处理大多依赖通用分词工具或医学知识库,而通用分词工具对专业术语的识别效果并不理想,且国内的中文医学术语标准化进程不足。针对此问题,提出一种基于统计信息对镜检文本数据进行结构化处理的方法。该方法以聚类文本为基础,基于断点词与重合串分词,利用分词词串的统计信息获取关键词以及词语类别信息,并进行词语扩充,从而得到最终词库作为字典。利用基于字典的双向最大匹配分词算法,对文本数据进行分词,并通过添加否定检出的规则,获取结构化数据。实验结果表明,该方法获取的医学词库的准确率达到了80%,实现了
其他文献
传统遗传算法很早就在列车运行优化研究中得到了应用,但是由于种群中染色体进化方向的不确定性和局部搜索能力不足,导致收敛速度缓慢和求解质量低下。针对以上问题,本文提出
自动问答系统对用户自然语言方式提出的问题,给出快速准确的答案,引起了学术界与工业界的广泛关注。问题分类任务通过自动判断问题类型,对提高问答系统回答问题的准确率具有
结构分析与设计语言(Architecture Analysis and Design Language,AADL)是复杂嵌入式实时系统体系结构建模的语言标准,但是对于嵌入式实时系统中大量存在的并发和交互,AADL并没有
利用维基百科备份数据库自动构建领域概念语义网络,为领域信息智能检索提供技术基础。对维基百科备份数据库进行下载、分析、筛选处理后,以网络技术学科为研究领域,利用维基百科数据库中的条目数据,设计算法,提取网络技术领域的所有概念;通过维基百科备份数据库中的分类、链接、重定向数据,提取该领域概念之间的同义及上下级关系,最终汇总形成网络技术领域概念语义网络。
为了避免粒子群算法过早收敛,提出一种包含局部驻留粒子的改进粒子群算法(CRPSO)。该算法将基本的粒子群算法的粒子称为主粒子,而当算法每找到一个新的全体最优点之后,将会在这
针对云任务调度中存在的效率低、费用高等问题,提出一种基于改进K-means聚类算法的云任务调度算法。依据虚拟资源的硬件属性,使用改进聚类算法对虚拟资源进行聚类划分;计算任
协同过滤是众多推荐技术中最主流的推荐技术,在个性化推荐系统中起着主导作用,然而随着大数据时代的到来,信息过载问题日益严重,评分矩阵越来越稀疏,传统协同过滤算法遇到了