基于文本加权词共现的跨语言文本相似度分析

来源 :软件导刊 | 被引量 : 0次 | 上传用户:fhdfhdfrtr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。
其他文献
在格式合同价值分析的基础上,对军事运输服务采购中的军方在相对方格式合同中博弈进行研究,分析格式合同双方当事人权利与义务的失衡,总结出军事运输服务采购需对相对方格式合同
升温,升温,再升温……临近,热浪一而再,再而三的连绵不断地翻腾在巴黎的上空,笼罩着地面上的人们,那些来自世界各地躁动的时尚人士冒着高温快速的在城市中央穿梭,像热锅上的蚂蚁。
航空应急投送保障基地是组织实施军事物流保障、部队航空应急投送的重要基础设施,其功能复杂,影响因素众多。运用SLP法对航空应急投送保障基地各作业单元进行了物流相关分析,
基于分组的交换核心是PTN技术最本质的特点。PTN适合多业务的承载和交换,满足灵活的组网调度和多业务传送,可以提供网络保护倒换功能,并且可对不同优先级业务设置不同保护方
<正>随着社会现代化进程的加快,教育发展的步伐总感到与现代化的节奏不能同步,甚至落后几个节拍,致使现代化的快节奏把教育拖得筋疲力尽。这是教育落伍了吗?答案是否定的。我
会议
农垦人,这称呼听起来就有一种亲切感.农垦,那是一片神秘的土地,那是一个神奇的团队,那是一个特殊年代的辙痕.
期刊
针对保养器材的随机消耗特点,首次将灰色—马尔可夫模型应用于车辆装备保养器材的储备预测,并以实例进行了验证。结果表明,灰色—马尔可夫模型既能揭示保养器材消耗的总体趋
近日,农业部提出了《关于加快推进农垦现代农业建设的意见》,深刻分析了加快推进农垦现代农业建设的重大意义,明确了推进农垦现代农业建设的指导思想,提出了加快农垦现代农业建设
文章针对当前由于电力负载急剧增长带来的传统抄表方式难的问题,提出了一种基于嵌入式ARM技术和新兴的低功耗、低成本Zigbee技术的无线抄表系统,该系统通过zigbeeMG2455芯片组