基于双语主题模型和双语词向量的跨语言知识链接

来源 :计算机科学 | 被引量 : 0次 | 上传用户:zhangjie333666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语言知识链接是指在描述相同内容的不同语言的在线百科文章之间建立联系。跨语言知识链接可分为候选集选择和候选集排序两部分。首先,把候选集选择问题转换为跨语言信息检索问题,提出一种将标题与关键词相结合从而生成查询的方法,该方法将候选集选择的召回率大幅提高至93.8%;在候选集排序部分,提出一种融合双语主题模型及双语词向量的排序模型,实现了英文维基百科和中文百度百科之间军事领域的跨语言知识链接。实验结果表明,该模型取得了75%的准确率,显著提高了跨语言知识链接的性能,并且提出的方法不依赖于语言特性和领域特性,因此可以很容易地扩展至其他语言和其他领域的跨语言知识链接。
其他文献
采用生物滴滤床对市政污水泵站产生的臭气进行净化,运行结果表明,生物滴滤床对污水泵站恶臭的特征污染物(H2S和NH3)的去除效果长期稳定在98%以上,能达到《恶臭污染物排放标准
目的:对非甾体抗炎药辅助关节镜治疗膝骨关节炎的临床价值进行分析,为膝骨关节炎的治疗提供指导。方法:选取我院2012年6月—2014年6月两年间采用关节镜手术治疗的膝骨关节炎
<正>前言 油脂科技范畴是相当广阔的,从事这一事业者往往对本职工作较熟悉,而对本专业内其它部分不甚清楚,可能甚至一无所知,这种情况是正常的。一些现代油脂科技名著(例如:R
为阐述海上保险合同的被保险人在损失发生时应对保险标的具有保险利益,针对英国1906年《海上保险法》对"保险利益"的定义在不同历史时期存在的3种司法或学理解释(分别基于法
龙和龙文化在源远流长的中华文化中占有重要地位,在中华民族的精神和文化生活中发散着不可替代的影响。然而,当前汉英翻译中龙的通行译法并不能起到传播中华民族特色文化的作
为了保证86型插座内部载流体(一般为铜件)的良好导电性和结构稳定性,论文就两种不同品牌的86型插座内部的铜载流件的不同结构进行了分析,并通过对比实验,测量出2种不同结构的
本文以《春》为例,具体详细探讨本课的教学设计。
作为应对经济全球化和信息化发展的一项重要举措,创新型城市建设已经受到我国城市的广泛关注并开展了大量探索性实践。本文主要对伦敦、纽约等世界主要创新型城市的创新型城
我国行政诉讼被告与行政主体具有相同的外延,行政诉讼被告的确认采取列举加排除的方式,对其资格有一定的条件限制,这种方式造成当前行政诉讼中被告难以确定,并且有些组织游离
<正>"懊悔",是人们很熟悉的一个词,因为谁都曾有过懊悔。自知"懊悔"是改正错误的起点,而做错了事又不知懊悔的人,很难避免不再犯同样的错误。但是,如果我们常常沉湎于一件事,
期刊