【摘 要】
:
该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析
【机 构】
:
延边大学计算机科学与技术学院智能信息处理研究室
【基金项目】
:
国家语委2015年度科研立项项目(教语信司函[2015]21号)
论文部分内容阅读
该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析补充了不同语言间一词多义现象造成的向量缺失;最后,在具有等价语义信息的同一语种空间中计算了两个文档之间的余弦相似度。该文工作避开了外部词典和知识库,利用中英韩三个语种的对齐语料库,建立了不同语种词汇间的对应关系。结果表明,共现词映射对计算不同语种文档之间的相似度具有较大影响,对同语义的不同语种文档(即译文)的检索准确率达到95%,验证了该方法的有
其他文献
9月15~18日2015中国香料香精化妆品行业年会在江苏无锡召开。会议呈现出6大亮点1.政府重视。国家食药监局、卫计委、质监总局、工信部等主管部门均出席会议,体现了国家相关部门
本文叙述了电路探测中示波器与探头放大器之间的匹配问题,并阐述了示波器对高速电子电路进行调试、验证或表征时应该注意的事项。
一谈到印尼音乐,我们就能想到《星星索》《梭罗河》《宝贝》等优美梦幻的歌曲,这些歌曲以优美的旋律、舒缓的节奏和独有的风味将聆听者带入梦境般美丽妖娆风姿绰约的南洋风光
2014年3月8日,“KODIAK·金五环立体经营管理分享会--暨德国杰德森集团珂蒂雅中国标杆店授牌仪式”在广州市恒大酒店盛大启幕。主会场高朋满座、流光溢彩,广州市东菁贸易有
幸福,是每一个人的向往,一家幸福的美容院不仅能让顾客喜欢来,也能凝聚员工。那么,你的美容院幸福吗?身为美容院的管理者,是否问过自己的员工“你幸福吗?”要打造一家让人倍感幸福的
圆度误差是机械零件及其互换性的重要指标,是产品质量的关键,这里提出一种基于线性神经网络计算圆度误差的方法。神经网络是一种非线性动力系统,具有运算和自适应的学习能力
本文介绍了AVXXXX微波噪声系数分析仪的结构设计,主要包括结构布局设计、散热设计和电磁屏蔽设计。
本文叙述了以8位单片机AT89C51为核心的声音录放系统的设计。介绍了系统的软、硬件设计的方法。文中给出了系统的硬件原理框图、软件流程圈。整个设计简明、清晰。
建立《访客记录表》,一方面可以让新顾客感受到美容会所管理的专业性和服务的人性化;另一方面,也是进行服务跟踪和客情关怀的依据,方便了美容会所的顾客管理。
直接转矩控制是一种新颖的异步电机调速方案,它是在定子坐标系下,通过检测定子电流、电压等变量直接计算和控制电动机的磁链和转矩,获得转矩的高动态性能。DSP具有运算速度快、