基于规则与统计的语气词用法自动识别研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:cangyueshang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代汉语语气词用法的自动识别研究是面向自然语言处理的现代汉语语气词知识库的重要内容之一,本文试图采用统计与规则相结合的方式进行现代汉语语气词用法的自动识别。首先构建了现代汉语语气词用法词典,在确定收词原则时,研究了基于主观认知的语气词和助词区分问题。其次进行了基于规则的现代汉语语气词用法的自动识别,创建了语气词用法规则库。由于人工总结的规则具有局限性,因此又研究了基于错误驱动的语气词用法规则自动提取算法。对于规则识别不好的词语,尝试了基于统计的语气词用法识别。最后结合统计方法与规则方法获取语气词用法自动识别的准确率。实验数据表明,使用统计与规则相结合的方法能使语气词用法的自动识别取得较好的效果。本文的主要工作包括:(1)构建了现代汉语语气词用法词典,确定了语气词用法词典的收词原则,并研究了基于主观认知的现代汉语语气词和助词区分问题。(2)构建了语气词用法规则库,在《人民日报》语料上初步完成了基于规则的语气词用法自动识别。(3)研究了语气词用法在多种语料库中的识别问题,从多种语料库中的语气词实际用法入手,修改和完善了语气词用法词典和语气词用法规则库。(4)研究了基于错误驱动的语气词“了”的规则自动提取算法。在使用人工书写的规则识别语气词用法的基础上,通过研究识别错误句子和正确标注句子之间的关系,自动获得新的规则集。(5)采用基于统计的方法进行语气词用法的自动识别,进一步提高语气词用法自动识别的准确率。(6)对基于规则和基于统计方法的结合进行了初步探讨,将用法识别准确率最高的模型作为该语气词用法自动识别的分类器。最后总结了本文的工作,指出了下一步的研究,提出了基于语气词用法的可行性应用前景。
其他文献
近年来脑功能研究在婴幼儿智力开发、认知功能障碍评估、老年痴呆症等脑疾病防治、脑疲劳监测等脑功能研究的许多领域取得了重大进展。脑功能的研究方法可分为主观评定法和客
数据挖掘自上世纪80年代后期出现以来,经过二十多年的发展,现在已成为机器学习和人工智能这两大热门领域的重要研究内容。特征属性提取、冗余属性约简、分类精度和算法效率的
随着计算机技术和现代信息通讯技术的迅猛发展,各种在线网络系统及其相关的衍生应用层出不穷。例如互联网、在线社交网络、移动通信网络、无线传感器网络等,这些在线网络系统
随着互联网在人们日常工作生活中的普及,网络上涌现了大量稳定可靠的Web服务。然而人们工作及生活需求不断提高,由于单一的Web服务功能比较有限,已经不能满足人们多方面的要
随着技术、市场需求的发展变化,未来无线通信网络将是多种接入技术并存、协同工作的融合网络,宽带化、泛在化和异构互连将成为未来宽带无线通信发展的主旋律。无线Mesh网络(W
论文分析了我国水利信息化现状、水利工程管理自动化建设的发展状况;根据目前我国水利工程的一系列特点,分析计算机远程监控技术对水利工程管理中的重大作用。针对浙江省特殊的
作为新一代测验理论的重点,认知诊断受到国内外研究者们的广泛关注[1]。认知诊断模型的建立是为了评估被试,得到个体的详细信息,教师可以通过得到的详细信息对学生进行个性化
嵌入式Internet是嵌入式技术发展历史上的又一个里程碑。它依托于Internet技术、嵌入式技术的发展。嵌入式Internet技术是嵌入式技术和Internet技术的结合,借助嵌入式Internet
20世纪90年代以来,由于计算机技术、网络技术、空间技术、通信技术的发展以及前所未有的推广普及,使得信息服务业迅猛崛起,并成为21世纪最具潜力的产业。信息产业在整个国民
网络开发平台提供扩展网络应用所需的基本框架,包括网络数据处理的基本模块以及各种系统仿真支撑模块。平台使得用户可以根据自己的需求快速建立系统原型,并由此在早期评估系