融合聚类触发对特征的最大熵词性标注模型

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:jianxiangqiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决传统HMM词性标注模型不能包含远距离词特征的问题,提出了形如“WA→WB/TB”的触发对来承载远距离词特征信息,并采用平均互信息量度对触发对特征进行选择.在最大熵框架下,将选择后的触发对特征加入到词性标注系统中.利用矢量空间模型提供的语义相似度计算功能进行词语聚类,聚类的结果和语义词典融合,建立聚类触发对特征用来解决触发词“%”的数据稀疏问题.实验结果表明,与HMM相比,融合了聚类触发对特征的最大熵模型标注错误率减少了34%.
其他文献
网站提供了政策法规、办事指南、科普园地等功能,及时为镇安乡人民提供最新的计划生育信息,使百姓能及时了解计划生育政策法规,减少计划生育违纪现象。
针对高职院校发展迅猛,人才培养目标与实践相脱节,推进实践教学改革迫在眉睫,而教学与生产结合是发展的必然趋势,学校与企业合作又是产教结合的必经之路,而校企合作模式及组织管理
在共享存储环境中,传统全局缓存管理的两个缺陷:1)共享缓存空间的多个应用之间相互干扰,每个应用不能公正地共享缓存资源.2)总体的缓存资源利用率较低.设计了一种基于分区的
关于Hanoi塔问题的非递归算法已有大量的研究.运用薛锦云教授自创的PAR方法和循环不变式开发的新策略,形式化推导出逻辑结构清晰的Hanoi塔非递归算法及其循环不变式,并用Dijk