基于条件随机域的词性标注模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:xiaziaipao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词性标注主要面临兼类词消歧以及未知词标注的难题,传统隐马尔科夫方法不易融合新特征,而最大熵马尔科夫模型存在标注偏置等问题。论文引入条件随机域建立词性标注模型,易于融合新的特征,并能解决标注偏置的问题。此外,又引入长距离特征有效地标注复杂兼类词,以及应用后缀词与命名实体识别等方法提高未知词的标注精度。在条件随机域模型框架下,进一步探讨了融合模型的方法及性能。词性标注开放实验表明,条件随机域模型获得了96.10%的标注精度。
其他文献
双关修辞在我国文学发展中有着悠久的历史,是人们喜欢的修辞方式之一。所谓双关语,是指在某种特定的语境下,利用一词多义或谐音等效果,使用同一语句表达双重语义。一般情况下
目的通过健康管理互动平台对2型糖尿病患者综合干预的效果评价,了解该措施对改善糖尿病的有效性。方法采用方便抽样原则,选取山东省青州市某企业236例2型糖尿病患者,通过健康
目的:探讨治疗中晚期宫颈癌同步放化疗的化疗方案选择。方法:96例中晚期宫颈癌患者同步放化疗随机分成顺铂组(30例)、多西紫杉醇组(34例)及顺铂联合多西紫杉醇组(32例),观察3
文章通过对金面的耐腐蚀性机理进行了探讨,对电镀软金过程采用不同的电镀时间,电流密度,电镀次数形成不同的金、镍层厚度的板件,用盐雾和酸雾实验研究不同工艺加工的金面耐腐
随着银行业的开放,理财市场也必将成为中外资银行未来竞争最激烈的领域之一。本文首先从三个方面分析了我国理财市场存在的问题,论述了我国理财市场存在的问题所带来的风险与
采用不同方法分别制备了氨丙基功能化二氧化硅(APS)、二氧化硅负载N,N,N’,N’-四甲基-N’’-丙基胍(STMPG)及其离子液体,利用FTIR、BET、元素分析、13C MAS NMR和TG等技术对所制
采用不同类型半固化片设计出多种叠层结构,考察其对高速PCB耐热可靠性的影响,发现扁平玻布(1067、2313等)耐热可靠性较差,无法满足客户无铅焊接要求。同时从理论上分析发现,
为实现多领域建模仿真环境与其他仿真环境的联合仿真,提出基于Modelica多领域建模的联合仿真方案.该方案基于Modelica多领域模型的连接机制,通过Modelica模型与Simulink模块
<正> 1978年,在“文革”结束以后复刊的首期《中国语文》上,有人撰文指出一种“流行的病句”,希望引起大家重视。下面先从文中摘引两个例句:
目的了解陕西城乡居民合理用药认知现状,为有针对性地制定用药知识宣传和健康教育策略提供依据。方法采用分层整群抽样法,随机抽取陕西省碑林区、秦都区、富平县城乡居民1203