基于多层特征的字符串相似度计算模型

来源 :情报学报 | 被引量 : 0次 | 上传用户:yaoyaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对计算字符串相似度传统方法的不足之处,提出以相似元作为字符串的基本处理单元,综合考虑相似元的字面、语义及统计关联等多层特征的字符串相似度计算方法.对常规计算方法中存在的,由相似元排序引起的相似元位置信息丢失问题进行了修正.实验结果表明该算法的有效性,并且对句子间、段落间的相似度计算有启发意义.
其他文献
实现文献分类法之间的互操作是信息组织和检索的迫切需要。目前在国内外大多数分类法之间互操作研究项目中,基本上是采用人工判断的方法来建立类目映射关系。笔者认为,《中国图
本统计期内(3月1日至3月7日),全球市场跌多涨少,但A股较外围市场表现相对较强,其中创业板最为强势,连续j中高后距离年线只有一步之遥。资金面方面,3与7日央行开展1055亿元MLF操作,恰
随着全球一体化的进程,国际通用语言英语也变得越来越重要了,中专学校英语教学工作的现状与教育教学改革和社会发展的要求已不相适应,教育改革的主旋律是以培养创新精神和实践能
估值进一步修复继续增配地产由于中美贸易谈判取得阶段性进展,人民币持续升值,以及美国转入降息周期,市场风险偏好度上升。前期悲观的预期以及流动性收紧导致地产板块处于历
JSP是基于Java Servlet以及整个Java系统的Web开发技术,为基于Java环境开发多层结构的动态Web应用程序提供一种方便、快捷的方法.本文分析 JSP技术的基本原理、技术特点,并通
据雪球一篇名为《福晶科技:3C精密加工需求引爆固体激光器,非线性晶体收益显著》的文章报道,福晶科技(002222)2018年打算将晶体生长炉扩产到1000台。股市动态分析周刊记者致电福晶
近年来我国玉米育种取得巨大进步,不论郑单958类、先玉335类,还是迪卡类等品种,均出现井喷现象,对提高玉米产量,保障国家粮食安全起到重要作用;但这些品种大多停留在模仿阶段
本文提出了一种对中文文本摘要中抽取出的句子进行重述的方法。首先使用基于统计的方法对文本进行特征统计,计算词和句子的权重,摘取出权值较高的句子;然后对这些句子应用一种基
10月20日,中华人民共和国第一届职业技能大赛“倒计时50天”启动仪式在广州举行。经过社会广泛征集、网络投票、专家评审等环节,中华人民共和国职业技能大赛标识终于-锤定音,
新时期医院党务工作的开展必须满足时代发展需求,只有这样才能促进医院朝着一个良好的方向发展,因此党务工作人员要从干部队伍、医疗工作者、服务人员等方面建立各种保障机制