基于汉语二元同现的统计词义消歧方法研究

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:fengliming33645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用《汉语同义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单词译文;对大规模汉语语料库以B+树算法为骨架统计了汉语词组二元同现频次。在英汉机器翻译中,针对翻译的英语句子应用汉语词组二元同现的统计结果形成词义消歧矩阵,再针对消歧矩阵提出了一种贪心的选择算法,以此完成译文选择。 By using “Chinese Synonyms Lin” and English-Chinese corpus, word translations of English-Chinese dictionaries are expanded by “bilingual alignments.” Binary co-occurrence frequency of Chinese phrases is calculated on the basis of B + tree algorithm for large-scale Chinese corpus. In the machine translation of English and Chinese, the semantic disambiguation matrix is ​​formed by applying the binary co-occurrence statistics of Chinese phrases to the translated English sentences, and then a greedy selection algorithm is proposed for the disambiguation matrix to complete the translation choice.
其他文献
为了研究混杂纤维对自密实混凝土(self-compacting concrete,SCC)工作性能及力学性能的影响,进行了4种纤维体积掺量(0%、0.05%、0.10%和0.15%)的纤维SCC(玄武岩纤维、聚丙烯
心脑血管疾病是一种临床上较为常见的疾病,每年有超过2500万人死于心脑血管病[1],其中我国占了20%,主要是发生在中老年人中,患病可能性超过了70%~80%。而急性脑血管病又是心
以荞麦新芽蔬菜为研究对象,利用比色法和发光化学法测定了荞麦新芽蔬菜提取物对DPPH自由基、羟基自由基及超氧自由基的清除效果。结果表明,荞麦新芽蔬菜提取物对DPPH自由基、羟
创业型大学实现全面而又彻底的学术资本转化,知识有价是其理论基础,而且只有遵循学术产品的市场交换原则,才能更好地彰显创业型大学的使命与责任。创业型大学推进学术资本转
目前,异基因造血干细胞移植(allo-HSCT)已广泛应用于造血系统疾病的治疗,但移植术后也存在一系列并发症。NK细胞的运用为改善allo-HSCT受者预后带来希望,供者来源NK细胞通过其
目的探讨腰麻-硬膜外联合阻滞应用于分娩镇痛的效果观察及评价。方法将2016年2月至2017年3月分娩镇痛产妇90例随机数字表法分组。对照组实施连续硬膜外麻醉,观察组实施腰麻-
[目的]揭示土壤全量养分空间分布的异质性,为农田的科学管理及提高作物产量提供理论依据。[方法]通过GIS技术,分析了辽宁省不同土壤深度全碳、全氮、全磷和全钾的空间分布状
给出了拉格朗日乘数与影子价格之间的关系,并应用拉格朗日乘数法求解出线性规划问题的解及其影子价格.
科学家在探索生命现象的过程中不断发现并总结出基本的原理和普遍规律,但又发现任何原理和规律几乎都有例外。但当普遍性知识根深蒂固时,“例外”就容易被忽略。教师应关注高中
<正>教育是有温度的科学,积极心理学是关注人幸福的科学,两者的结合,就是让学生如何幸福地成长。教育过程中教师传递出去的温暖能直接影响到学生当下的幸福体验以及对未来美