多次Hash自动分词算法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:huojugjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词典是自动分词基础,分词词典机制的优劣直接影响到中文分词速度和效率。本文在对中文编码体系和中文分词的算法进行研究的基础上,设计一种新的分词词典,以及基于该词典结构上的一种多次Hash自动分词算法。分析表明,该算法的时间复杂度有很大的改善。
其他文献
摘要:本文提出了一种新的基于Petri网的工作流挖掘算法,不局限于顺序流程的挖掘,而且能够有效地对α算法无法处理的短循环进行挖掘,不仅具有严密的数学理论支持,同时具有直观和易
文章介绍了一种基于AD1674数/模转换的材料性能测试系统的用途、结构组成、工作原理等,阐述了该测试仪器电子控制系统的硬件设计,包括控制单片机、数字、模拟电路、输入输出
采集机械磨损表面形貌轮廓曲线来分析器械部件的使用状态是检验检测工作的常用方法.文章通过小波变换对所需分析的轮廓曲线进行分解,可以使其复杂结构特征精细化,通过重构可
机器人机构的运动规划是进行机器人智能化设计的重要基础.文章针对关节型冗余度机器人的运动特点,以机器人运动学的理论作为基础,建立了关节型冗余度类机器人机构的运动学模
基于PC的开放式数控系统是目前发展的方向,传统的封闭式数控系统(NC)已经逐渐被开放式数控系统所替代.文章通过对数控系统的发展趋势以及圆柱凸轮加工方法、轮廓轨迹创成原理
介绍了基于特征技术的检测信息模型,建立了基于特征测面的零件检测数据模型.同时,对测头的检测运动轨迹进行了规划,实现了自动检测功能.
开孔构件的开孔形式各异,增加了其网格划分难度.另外,全六面体网格划分一直是有限元网格划分中的难点之一,实现开孔构件的全六面体网格划分具有重要的现实意义.文章基于开孔
论文在分析人体肠道的生理结构和蠕动特性的基础上,介绍了实验台的设计思路,设计了实验台的总体结构,并论述了实验台的工作原理和分析了微机器人的在管道内运行时的受力情况.
分析了主流软件PLC系统的特点,讨论了基于Windows NT和DOS平台的软件PLC的不足.建立了基于RTLinux的软件PLC系统.该系统硬件由PC机、通用I/O、继电器卡等组成,软件系统由非实
工艺路线是连接产品设计和制造的纽带 ,它是一项经验性很强、技巧性很高、涉及多方面知识和信息的工作 ,因此工艺路线设计极其复杂。文章提出一种基于CAD的工艺路线自动分析方法 ,并在现有的CAD软件基础上 ,结合支持OLE的编程语言和数据库技术 ,编制出相应的应用软件。将其应用在实际的工艺路线分析中 ,可以正确生成指导生产的零件工艺路线 ,使工艺路线的编制效率大幅提高。同时 ,采用人机交互的方式可以使