【摘 要】
:
医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点.针对基于传统余弦公式医学文本相似性分析
【基金项目】
:
湛江市科技计划项目(编号:2012C3102009)广东医学院青年基金项目(编号:XQ1353)
论文部分内容阅读
医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点.针对基于传统余弦公式医学文本相似性分析算法在性能上的缺陷,提出了一种基于全文索引技术与余弦公式医学文本相似性分析算法,对医学文本相似性进行分析.采用全文索引技术对医学文本数据相关关键词进行索引,并根据若干关键词在索引中检索出部分数据,从而减少计算复杂度,提高效率.实验表明,该方法比基于传统余弦公式医学文本相似性分析算法具有更优的性能.
其他文献
体育督导工作的开展,是确保我国各项体育政策方针和法律法规得到全面贯彻执行的关键,同时也是当代素质教育理念得到推广落实的关键。现阶段,我国学校体育教学工作开展中依然
自发的全局定位能力是自主式移动机器人系统的一项重要功能。在导航定位领域,机器人需要对自己的位置和整个场景地图进行估计,这对于概率建模而言,无论是在计算上,还是可操作性上都是很难实现的,因此需要引入统计学中的采样来完成这一任务。SLAM算法的提出,让机器人导航有了巨大的进步,并且易于扩展,基于它的各种改进,可以支持对场景中动态物体,如人、搬动的桌椅等进行计算,不影响整个地图的建立。系统在原有SLAM
本文通过文献法、问卷调查法、访谈法、数理统计法等研究方法,对宁夏大学专职教师亚健康总体现状进行分析。研究对比不同年龄、职称、性别、学历的宁夏大学专职教师亚健康发
本文通过研究我国优秀女子链球运动员罗娜的力量训练方法,总结和归纳链球的力量训练特点,归纳了一般力量训练方法手段的内容与专项力量训练方法手段的内容。
本文采用文献资料法、专家访谈法、逻辑推理法、归纳演绎法等研究方法,对梁山武术文化旅游资源价值、开发现状和存在问题进行分析,并提出相应策略.
踝关节在田径短跑训练中是非常重要的因素,占短跑脚部力量的60%。在短跑中,它不仅可以减轻短跑着地时的摩擦力和阻力,还可以在保障后蹬力量的前提下获得更快的速度。踝关节力
为了解湘西州传统体育文化遗产保护现状,促进湘西州传统体育文化遗产的保护与传承,本文采用文献资料法、实地考察法、逻辑推理法、专家访谈法、逻辑演绎法及数理统计法等研究
第15届北京田径世锦赛中国田径的"1516突破行动计划"初现成效,获得了1金、7银、1铜的成绩,奖牌总数位居第4位,团体总分94分,位居积分榜第5位。本文通过文献资料法、数理统计
设计了适用于烟草行业的工业控制系统的安全防护系统。针对现有烟草行业工控系统的实际安全问题,提出了包括信息技术(IT)和操作技术(OT)在内的全方位防护系统。烟草行业现有
随着高速公路的车流量日益增长,偷逃通行费行为也随之增多,在发现疑似行为时如何快速便捷地跨路段调取流水数据及现场图像,是稽查能否成功的一个关键。为了达到快速响应的目的,需