使用二级索引的中文分词词典

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cmfu2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文信息处理的基础,在诸如搜索引擎,自动翻译等多个领域都有着非常重要的地位。中文分词词典是中文机械式分词算法的基础,它将告诉算法什么是词,由于在算法执行过程中需要反复利用分词词典的内容进行字符串匹配,所以中文分词词典的存储结构从很大程度上决定将采用什么匹配算法以及匹配算法的好坏。在研究现存分词词典及匹配算法的基础上,吸取前人的经验经过改进,为词典加上了多级索引,并由此提出了一种新的中文分词词典存储机制——基于二级索引的中文分词词典,并在该词典的基础上提出了基于正向匹配的改进型匹配算法,大大降低了
其他文献
工艺建模区别于设计建模,更多的是考虑装夹、干涉检查、走刀路线等加工工艺要求.为了获得符合工艺要求的工艺建模,加工出合格的产品.以汽车润滑箱底座数控加工为例,通过对零
目的基于CT征象利用二元Logistic回归建立预测模型来评估表现为纯磨玻璃结节肺腺癌的恶性浸润程度。方法回顾性收集2015年1月~2018年4月大连大学附属中山医院纯磨玻璃结节144
期刊
本文运用芦原义信在《外部空间设计》中提出的'十分之一理论'(one-tenth theory)进行分析,并结合两个工业建筑有机更新项目的外部空间使用后评价,得出工业建筑有机更
由河北省遥感应用协会提供的河北省遥感技术应用科普知识图片,近期在河北省科学技术馆“走近遥感”专栏中公开向社会展出。展览图片列举了由我国遥感卫星监测到的自然灾害,如台
中国空间技术研究院一中国航天器的生产基地,我国的大部分的航天器和各类地球卫星均出自于此,是我国航天器的大本营。2007年,笔者带着岁末年初的喜悦,有幸踏进了这座神圣的殿堂,参
为了简化和规范农村公路工程验收工作,结合农村公路工程项目特点,对农村公路工程项目交工与竣工验收合并为一个阶段实施,并对此进行了研究.对一阶段竣工验收条件与工作内容的
交通作为实时性极强的复杂离散系统,是所有交通参与者、交通设施共同作用的结果。智能体(Agent)技术作为一种基于个体的离散系统建模方法,十分适合于解决此类系统问题。在简单介
复数相等的条件的实质是把复数等式转化为实数等式,从而去解决实数问题.理解了这一点,就得到了解决复数问题的一把钥匙——凡是给出了复数等式,就可以通过复数相等的条件把已知复
为了分析TX型方钢管相贯节点在复杂边界条件下X支管平面内抗弯刚度的影响,以相贯节点足尺试验为基础,采用量纲分析得到影响相贯节点抗弯刚度的主要无量纲参数,利用有限元软件