基于跨语言文本分类的跨语言特征提取方法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:gaoliqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文本分类算法的实用化和多语种信息的日益丰富,当机构或组织的文档管理部门日益依赖自动文本分类时,如何解决多语种文档的归类问题成为新的研究热点,跨语言文本分类技术就是在这样的背景下提出的。本文以国家图书文献中心(NSTL)的多语种语料为研究对象,以一部科技类的汉英科技词典为资源工具,提出了一种基于跨语言文本分类的跨语言特征提取方法,实验结果验证了在简单翻译资源条件下对科技文献进行跨语言分类的可行性,也为下一阶段建立实用跨语言文类系统奠定了基础。
其他文献
目的 研究交锁髓内钉内固定术治疗四肢骨折的临床疗效。方法 在我院2017年3月—2018年10月收治的四肢骨折患者中抽取96例进行研究,按照治疗方式的不同分为对照组和观察组,每
通过对穗部性状与单株粒重遗传相关通径分析及有关遗传参数的估计分析表明,穗部性状对单株粒重的贡献是由本身的直接效应和通过其它性状间接效应来实现的,是综合作用的结果。
日前,普陀区2014年度节能项目已全部通过市能效中心相关专家验收。本年度普陀区节能项目共18个,项目总投资1.31亿元,预期可节约标准煤2557.8吨。其中市级项目4个,区级项目14个。
教师在数学教学中要为学生提供充分的探究时空,发掘他们探究数学的智慧潜能,引领他们发现规律,形成概念,从而获得广泛的数学经验。
据报道,德国汉堡建成世界上第一座藻类发电建筑。该建筑由西班牙工程公司Arup设计,正面的镶嵌玻璃装有生物反应器,内有微藻类。这些藻类能产生生物量和热量,是一种可再生能源。此
6月5日,上海市人民政府举行新闻发布会,市经济和信息化委员会总工程师原清海在会上作了发言,介绍了上海市节能工作推进情况。指出,2013年,上海市节能工作取得积极进展,在市委、市政
近年来,微博投诉成为用户维权的新途径。面对海量微博投诉,企业如何在有限资源下实现微博投诉自动诊断和处理,引发了学术和业界的高度关注。微博投诉句识别是微博投诉自动化处理
目的观察即刻种植与延期种植在上颌单前牙修复中的应用效果。方法选取2016年5月-2017年5月于我院种植修复单颗上颌前牙患者74例,采用随机数字表法分为2组各37例。对照组予以
目的:探讨中药联合甲氨蝶呤( MTX)治疗异位妊娠的效果.方法:将 2001年 1月~ 2002年 8月 146例未破裂的异位妊娠患者随机分为中药加甲氨蝶呤组( 80例)和单用甲氨蝶呤组( 66例),
目的探讨孟鲁司特钠对小儿哮喘的临床治疗效果。方法将我院2016年1月—10月收治的80例哮喘患儿纳入本次研究,采取随机数字表法分为甲组(40例)和乙组(40例)。乙组给予常规治疗