【摘 要】
:
现有的中文自动校对方法使用字、词或词类的n元语言模型。它们的问题在:仅使用某种局部语言现象的统计特征,导致处理能力足,多种语言模型没有合一。该文设计实现了一个基于特征的中文自动校对方法。该方法综合考虑了中文文本中字词和词局部语言特征以及长距离的语义特征,并且采用Winnow方法进行特征学习。评估实验表明该方法召回率达到85℅,准确率达到41℅,订正率达到51℅。性能比目前常用的词的N元模型方法有明
【机 构】
:
清华大学计算机科学与技术系(北京) 微软中国研究院(北京)
论文部分内容阅读
现有的中文自动校对方法使用字、词或词类的n元语言模型。它们的问题在:仅使用某种局部语言现象的统计特征,导致处理能力足,多种语言模型没有合一。该文设计实现了一个基于特征的中文自动校对方法。该方法综合考虑了中文文本中字词和词局部语言特征以及长距离的语义特征,并且采用Winnow方法进行特征学习。评估实验表明该方法召回率达到85℅,准确率达到41℅,订正率达到51℅。性能比目前常用的词的N元模型方法有明显的提高。
其他文献
本文对高新技术在调浆车间的运用进行了探讨。文章阐述了集散控制系统的组成和特点,对几种典型的集散控制系统及溢流染色机集散控制系统进行了介绍。
本文对染整生产用水处理工艺进行了探讨。文章围绕印染用水指标及分析、河水处理解决方案、染色用水常用处理工艺流程、河水利用经济效益分析等进行了阐述。
阐明了FCS的技术特点;叙述了FCS的体系结构;介绍了FCS的通信网络;阐述了应用实例;指明了FCS的发展趋势。
本文对染整企业的节能减排问题进行了探讨。文章围绕优质疏水阀与节能节水、高温凝结水无泵背压自动提升回收技术在实际应用中的节能节水效益分析等进行了阐述。
本文叙述了高效燃气红外预烘染色机数字化控制的必要性和系统的构成以及印染工艺参数在线检测和自动化控制在染色机控制系统数字化过程中的重要作用。
在灯芯绒布加工过程中,退浆落布回潮率直接影响到刷绒效果。美湿卡M909回潮率测控装置,可使退浆落布回潮基本控制在10%~12%之间,从而提升品质,降低能耗,提高生产效率。
纺织业日前存在的诸多问题中,高新技术的采用、机械设备的更新换代,是提高产品质量档次和产品附加值的重要问题。本文介绍的"马氏JD型电加热烧毛机",创造性地采用以电能为能源,以功能性陶瓷材料为发热体,应用于织物烧毛加工的工艺中,该项技术在国际和国内均为首创。几年来经大量客户实际使用证实:该没备运行成本低,节能效果极其显著,操作简便、工艺性能稳定、无燃料燃烧的烟气排放,并且在去除钢性绒毛和小棉结方面,性
本文对织物染整美湿卡回潮率测控装置进行了介绍。文章围绕美湿卡回潮率测控装置的性能和特点、回潮率测控装置工作原理和使用方法、回潮率测控装置质量和节能减排方面的效果等进行了阐述。
涂层在纺织品后整理中扮演着非常重要的一个角色。荷兰STORK公司研发了一个独特的涂层应用系统--闭合式刮浆系统,它提供了完美的施加量控制。另外它可以应用各种介质,如色浆和不稳定泡沫。本文简单介绍了圆网涂层和详细介绍了闭合式刮浆系统的技术和工艺。
对广东省东江流域的惠州-东岸段河流的多区段,多个污水输入的河道,根据已掌握的水文质监测条件,给出了发合实际的多滞后控制系统的数学描述,并采用前而章节研究的多滞后纯性定常控制系统的关联镇定的Lyapunov镇定等价法,研究了这一河流的污染控制问题,通过这一案例分析,检验前面章节得到的稳定性分析、镇定控制设计方法的有效性和实用性。