基于规则库和聚类分析的复句短语字段的自动识别研究

来源 :华中师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:robertruntian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.
其他文献
《大学计算机基础》课程"自主学习"模式的实践,目的在于提高教学效果,培养学生的自主学习能力。该模式依靠网络课程中丰富的学习资源,充分挖掘学生在学习过程中的主动性,发挥
摘要:随着移动Ad hoc网络(MANET)技术的发展,安全问题受到越来越多的关注。认证服务是MANET安全的基础。近年来,研究人员提出了各种MANET的认证方案,但对于开放环境下MANET的匿名性要求考虑较少。本文基于可信计算技术中的直接匿名证明协议(DAA)[1],提出了一种适合于MANET环境的匿名认证方案,在解决MANET无中心认证问题的同时,实现了节点身份的匿名性,增加了签名的可追踪性,
利用取代苯肼盐酸盐与丙酮酸、1,3-二苯基-1,3-丙二酮反应合成了3种取代吲哚衍生物.采用“一锅法”对酯化反应进行了改进,以盐酸酸化的乙醇作溶剂,苯磺酸催化,一步得到取代的吲哚酸
高层建筑由于高度较高使建筑物的下部结构受力比上层结构要大得多,因此在建筑过程中对高层建筑物的结构形式和柱网布置就有更高的要求。本文通过对梁式转换层的施工技术进行
华中师范大学夸克物质物理团队2006年入选教育部“长江学者与创新团队发展计划”中的创新团队。该团队由物理科学与技术学院活跃在国际前沿、富有创新精神、年龄结构合理、研
建立了标准级配及3种不同离析程度的粗集料离析级配和3种不同离析程度的细集料离析级配。模拟了不同离析状态的混合料级配、沥青用量和空隙率等关键指标的变异特性,通过一系
该文介绍了CAN总线技术在通信控制中的应用。利用CAN控制器,收发器和51单片机构成简单的控制通信系统。CAN总线较普遍使用的rs232/485等通信方式,具有传输距离远,传输稳定可靠等优点,且电路实现简单。能够在高稳定性的控制通信领域实现数据的交换、传输,应用前景广阔。