基于多Agent策略的汉语语块识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文根据汉语自身的特点,及不同汉语语块具有的不同敏感特征,从多Agent理论入手,进行了基于多Agent策略的汉语语块模型的探索。本文研究从以下几个方面展开:1、对比分析了四种传统主流语块识别模型在汉语识别中的性能,从理论和实验结果两方面研究了这些模型的特点,揭示了造成这些模型在识别英语和汉语时性能差异的原因。明确了当前汉语语块识别的主要问题。2针对汉语语块识别特征灵活和语料规模较小的现状,提出了一种基于多Agent策略的汉语语块识别模型。此外,本文还对汉语语块识别中关键的名词语块的识别提出了词性串规则结合边界统计的算法,最终得到了较好的识别结果。3在利用各种不同的敏感特征识别语块时,对最优规则集进行总结,并规划解综合的结构。最后,综合运用本文所研究的各种方法,实现了一个支持基于多Agent策略的汉语语块识别系统。
其他文献
网格代表着一种先进的分布式计算基础设施,它是一个集成的计算与资源环境,其中吸纳了各种各样的计算资源,并将它们转化为可靠、标准且经济的计算能力。网格技术支持在动态、
本文重点研究了SIP协议的消息流程及消息的内容,以及SIP协议具体的应用情况,研究了其中的端系统测试方法及用于描述抽象测试用例的TTCN语言,对比分析了几种端系统测试方法及适用
中药是我国的国粹,经过上千年的发展,积累了大量的数据,以往对于这些数据的应用,仅仅是提供一些简单的搜索及统计功能,中医药数据中蕴涵的信息未得到很好的利用。随着世界性
  Web技术的日益成熟为互联网注入了活力,但是越来越多的数据让人们迷失在信息的海洋中,对人们有用的只是其中少之又少的一小部分。不同的用户面对的都是千篇一律的web页面。
  近年来,随着移动通信技术的发展和应用的普及,无线定位业务作为一种新兴的增值业务正越来越受到人们的欢迎,尤其是随着美国E-911(Emergencycall‘911’)法案的颁布,无线定位
为消除“信息孤岛”,让宝贵的信息资源为经济社会发展服务,迫切需要建立安全统一的信息交换平台。电子政务的特点对电子政务系统的信息处理、传输和交换的安全性提出了严格的要
主要从硬件体系和软件体系的角度,对远程监测系统做了一些探讨,并以山西铝厂隧道电缆温度及烟雾监测报警系统为背景,对系统的实现进行了深入的研究。 第一章对远程监测系统进
动态联盟、资源共享和信息安全是现代制造资源重组中的关键问题。制造企业动态联盟的出现,带动了制造业传统生产方式的变革,实现了联盟企业间的优势互补、相互协作和资源共享
  各种未收录的汉语人名、地名、以及机构名称短语等专有名词的自动识别,能够提高中文文本的分析理解能力,是自然语言处理领域的重要和基础性问题,同时也是一项具有较高价值的
目前国内外车辆牵引性能测试中的信号传输仍然采用传统的一点一线的信号传输方式,测控点越多则信号线就越多,这给车辆牵引性能测试带来诸多不便,如电缆缠绕、压断。为了改进目前