资源贫乏型语言间文本相似度计算方法

来源 :指挥信息系统与技术 | 被引量 : 0次 | 上传用户:lyzhanhun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本相似度计算是自然语言处理领域的研究热点和难点。自2013年“一带一路”倡议提出以来,我国急需小语种国家和地区的商业情报信息。选取中文和藏文进行比较,并采用基于多级双语向量空间映射技术的文本相似度算法计算藏汉文本相似度。首先,对文本进行预处理,并对中文文本和藏文文本进行分词;然后,利用多级双语向量空间映射框架,将藏文词向量和中文词向量映射到同一抽象的语义空间下,词间相似度则由映射后的词向量计算得出;最后,计算得出基于词间相似度的文本相似度。利用已训练完毕的汉藏词向量得到最佳多级框架,再选择6个类别的中文
其他文献
6月30日一7月7日武汉市组织学习考察组赴广州、深圳、珠海、东莞四市,实地考察了广州市天河区及石牌村、星河湾小区,东莞市东城新区及宏远集团(宏远村),珠海市香洲区,深圳市
末梢神经炎,也称多发性神经炎,病因复杂,病程迁延,给患者带来较大痛苦,甚者造成残疾。目前无十分满意的治疗方法。我院自1991年来,共收治住院病人30例,在对症治疗及控制病因(
目的检测原发性肝癌(PHC)患者血清中Glypican-3(GPC3)与甲胎蛋白(AFP)的水平,以探讨PHC患者血清中GPC3的表达和临床意义及与AFP联合检测对原发性肝癌的诊断价值。方法应用酶联免疫
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
广东华路交通科技有限公司的前身是成立于1960年的广东省交通科学研究所,于2002年转制为国有企业,现为广东省交通集团有限公司唯一一家全资科技型子公司,是从事公路交通科技研发
杨梅是浙江省杭州市的传统名果之一,其果实色泽艳丽,风味独特,营养价值高,深受消费者的喜爱。近年来,随着人们生活水平的不断提高,杨梅的需求不断增加,目前,萧山区杨梅栽植面积为900h
花鼓戏是一种地方戏曲形式,其按照地域特征可以分成湖南花鼓戏、湖北花鼓戏、河南花鼓戏、陕西花鼓戏、安徽花鼓戏以及山东花鼓戏等多种形式。近年来,国家加大了对花鼓戏的保
广东交通集团检测中心是完全按照现行国际标准《检测和校准实验室能力的通用要求》(ISO/IEC17025:1999)和《检查机构能力的通用要求》ISO/IEC17020:1998运作的大型综合性检测试验室
榛子是辽宁东部地区的重要果树树种之一。当地榛树资源的种类为平榛(Corylus heterophylla)。过去主要以直接利用野生平榛林的方式进行生产,经营管理问题较多。近年来,榛实在国内
为适应近年电子商务在我国迅速发展对于电子商务人才的紧迫需求,电子商务专业在各院校迅速兴起,但目前电子商务专业毕业生就业情况与人才市场旺盛的需求存在较大的差距。提出