【摘 要】
:
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并
【基金项目】
:
国家自然科学基金资助项目(61100085), 陕西省教育厅专项科研计划基金资助项目(11JK1029)
论文部分内容阅读
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并在此基础上抽取了一个来自源端的单词特征,然后基于中英NIST数据集,采用最大熵分类器来验证不同单词后验概率特征(WPP)独立使用及与其它特征组合后使用时对错误检测性能的影响。实验结果表明,采用不同方法计算得到的单词后验概率特征对分类错误率的影响是显著的,并且在单词后验概率和语言学特征组合基础上加入源端单词特征,可以显著降低分类错误率(CE
其他文献
中国社会正经历从计划经济向社会主义市场经济转变,从单一型社会向多元化社会转变,从传统社会向现代社会转变的重要的历史过程.在这一社会的转型时期,广大青年也正在经历着心
黄土高原大规模退耕还林(草)对土壤有机碳会产生显著影响。相比总有机碳,土壤活性有机碳对区域微环境变化响应敏感,且能灵敏地反映土壤质量变化情况。为了探讨黄土高原不同植被
提出一种改进的量子遗传算法(IQGA)。在编码方面提出了一种根据所求问题精度动态确定量子染色体基因长度的编码方法,考虑了计算解的精度和搜索效率的平衡关系。探讨了量子旋转
当前未成年人教育要坚持育人为本、德育为先,在巩固已有成果的基础上.进一步加强社区、家庭和学校三位一体教育建设.理清三方教育实施主体之间关系.明确其地位和责任,加强沟通与联
下面有25道题,每道题都有5个备选答案.请根据自己的实际情况,在题目下面圈出相应的字母,每题只能选择一个答案.请注意这是测验你的实际想法和做法,而不是问你哪个答案最正确.