【摘 要】
:
文法具有可以处理复杂的嵌套结构的优秀特性,完备的文法库是问题自动理解的质量与精度的基本保障。若能将统计方法引入到设计文法的各个阶段,将能极大地提高系统的整体效率及
论文部分内容阅读
文法具有可以处理复杂的嵌套结构的优秀特性,完备的文法库是问题自动理解的质量与精度的基本保障。若能将统计方法引入到设计文法的各个阶段,将能极大地提高系统的整体效率及文法的覆盖度。咨询语句文法学习是指从这类文本文档中,通过研究知识获取的方法,在反复实验后学习出文法。随着信息技术的发展,以文本形式存在的咨询语句文档是一种重要的用于知识获取的知识源。但是,由于咨询语句数据规模较大,手工设计文法具有很大的局限性。由于咨询语句文档存在庞大的数据,直接进行文法学习会很耗费时间,本文提出了两种预处理的方法:其一,提出无关语的概念并进行了无关语的识别,人工整理部分无关语作为种子无关语;其二,提出了一种基于种子无关语自动识别的方法。预处理之后再聚类出相似问题的集合,在识别咨询语句中的无关语后进行咨询语句的相似度计算会更加准确。进而本文提出一种基于2-gram句子间相似函数的层次聚类方法,聚类后的结果是一个个集合,每个集合中咨询语句的语义基本相同。模式在咨询语句中频繁出现,具有明显的文法特性。为了寻找自然语言的咨询语句中词类之间的特殊内在关系与规律,特别是词模之间的语义关联性及词模的结构特征,本文采用带有平均间距限制的k-频繁序列(k=2)覆盖作为判断词模质量的标准。首先通过频繁序列算法获得k-频繁序列,然后计算出每条词模的覆盖度。在海量的语料库中,无法人工阅读并提取词条之间的语义关联,但是可以通过概率和间距提取词条之间的语义关系,实验表明该方法有效。本文提出的文法学习方法综合考虑了可选项和歧义项的处理。本文提出的文法学习方法具有良好的普适性,可以在电信等许多领域应用。
其他文献
WebGIS是当前GIS发展的一个重要方向,是GIS走向“社会化”的有效途径,也是构建“数字地球”的核心平台之一。虽然WebGIS有多种实现方式,但是随着WebGIS应用的不断加深,原有的基于
工作流(Workflow)技术是进入90年代以后计算机应用领域的一个研究热点。对工作流技术进行深入的研究对于提高我国企业的信息化程度、运行效率以及竞争能力都有着重要的意义。
搜索引擎提供了大规模文档集的检索接口,但是用户必须先把信息需求表达为检索词序列,然后再由搜索引擎检索出与需求相关的文档。问答系统是新一代的搜索引擎,它先接收自然语言描
近年来,安防监控系统在交通、军事、机场、银行、商场、社区等场所得到广泛应用。在诸多领域中,保证安防监控系统正常运行的重要条件之一是获得稳定、清晰、目标性强的监控视频
无线通信技术和计算机网络技术的发展为无线Ad hoc网络的发展奠定了基础。由于具有不需要集中式网络管理和基础设施的显著特点,无线Ad hoc网络在近年来受到越来越多的关注。
网格是新一代的互联网,是一种新的信息基础设施。它将是继互联网、WWW 之后的第三次信息技术革命,目前世界各国正投入巨资进行研究,可以说网格的研究和应用才刚刚起步。许多
随着信息技术的飞速发展,现代家庭已经逐渐演变成数字化、网络化和智能化的媒体中心。人们从家电设备、移动设备和电脑设备上获取、查看和管理越来越多的数字媒体信息。人们希
在我国,嵌入式硬件的发展日新月异,推出了龙芯、方舟、国芯等各种嵌入式处理器。无论是新硬件推广的需要还是当前嵌入式应用复杂性的要求,都必须提供与之配套功能强大的软件开发
介绍了设计模式的概念,面向对象开发中程序员更重视代码的重用性和可维护性,设计模式使人们可以更加简单方便地重复使用成功的设计和体系结构。设计模式是经验的文档化。它是
本论文从方型预制件的四步法编织原理入手,分析载纱器的运动规律及纱束的运动轨迹,利用控制单元法得到方型编织的内胞、面胞及角胞模型,进一步对圆型编织的原理及纱束的空间拓扑