融合主题模型的在线可比度计算研究

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:eric7272
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线挖掘可比语料是构建大规模可比语料库的可行途径之一,在线可比度计算是语料挖掘过程中的关键环节。本文提出一种融合词汇重合度和主题模型的在线可比度计算方式,主题模型选择能够进行在线学习的Online LDA,利用词对齐工具GIZA++进行主题映射,融合方式为加权求和。在下载的中英新闻语料上的测试结果表明,两种计算方式融合后的准确性比两种都要高。
其他文献
随着经济的发展和进步,信息技术的使用给现代教育带来了前所未有的变化.在我国中等职业教育中,开展英语教学的主要方式是课堂上课和课外资料学习.在目前的一些创新教育模式中
自2006年,安徽省高考语文开始自主命题。这一年的安徽的作文题为:请以"读"为话题.写一篇不少于800字的文章。该话题前面有一段提示语:自然是一本书,社会是一本书,父母是一本书,老
张江高科技园区已经走过了19年的开发历程,从一片阡陌农田发展成为拥有6000余家注册企业、20余万从业人员、经营总收入超1556亿元、税收近110亿的国内外知名高科技园区,正逐步
随着社会物质文明的提高,人们不断追求生活质量的提高,健康保健意识越来越强。创建和谐社会,珍爱生命,关爱生命,生命离不开水。可地表水污染严重,威胁饮水安全,绿色天然矿泉水就越显
近来,新词“潮”流行于网络及其他各种媒体,出现了形容词的新用法.
在视频监控场景中,由于车辆自身外观的多样性和相似性以及无约束的监控环境,以致很难通过全局外观特征区分不同的车辆目标。与全局外观特征相比较,局部区域特征更具区分能力。同时,为了兼顾算法的速度,本文提出一种基于区域与全局融合特征的以图搜车算法。该算法分为三个阶段:首先,以车辆IDs作为标签信息,训练一个车辆的全局特征网络;其次,加入局部区域特征网络,进而联合训练局部区域特征与全局特征网络;在推理阶段,
2006年5月美国People杂志将“世界上最美丽的人”的桂冠给了安吉丽娜·朱丽。虽然安吉丽娜·朱丽光彩照人,但她之所以成为最耀眼的明星则要归功于她对人道主义事业所
语文教育始终“存在”。但我并不想陈述其重要性以及如何搞好语文教育。作为语文教师,就从业经验而论,我早已深刻感受到语文教育确确实实被“遮蔽”了。到底被什么遮蔽.什么原因
当前的作文教学,教师总是自觉或不自觉地用一些理论去“忽悠”学生,而缺少一些具体的方法指导。学生作文写了很多,教师也批阅了很多、讲评了很多,却总也不见其效。尤其是对那些有