中文分词词典机制:次字拼音首字母哈希机制

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:forever_2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高现有基于词典的分词机制的次字查询效率,提出了一种全新的分词词典机制—次字拼音首字母哈希机制。首字查询仍使用成熟的基于逐字二分机制,在首字哈希表中增加该字的拼音首字母字段,次字按其拼音首字母散列到26个子表,子表中记录以首字开头的词组个数并设置次字索引表指针,第3字及其后的字串的匹配仍然采用目前成熟的词典机制。在次字查询时,可大大地缩小查询范围,从而加速了次字查询过程。实验测试表明,该机制在增加少量的存储空间情况下,时间效率提升了15%。
其他文献
在改革开放的新形势下,怎样才能更好地处理好农村干群关系?近几年,我们注重运用形象领导方法,用自己的模范行动增强干部在群众中的吸引力和感召力,进一步密切了干群关系,推动
郑州钢窗厂,象一户平平常常的人家,深深地隐在郑州西区的民居里。这个似乎还没有足球场大的四方小院里,无论春夏秋冬,“叮叮(口当)(口当)的金属之声长年不断,锤铸出一批又一
<正> 不久前,邓小平同志指出:“什么叫领导?领导就是服务”。言简意赅,深刻地揭示了社会主义制度下领导工作的本质,值得我们认真体会。这里,谈谈自己初步的认识。“领导就是
<正> 农家喂猫,一般只喂早餐和午餐,晚餐不喂,使猫儿保持七分饱三分饿,在晚间觅食捕鼠,其奥妙是掌握‘饱’与‘饿’这个‘度’,以调动猫儿捕鼠的积极性。然而,在现实工作中,
与下属合作得是否愉快且卓有成效,完全取决于你与下属相处的能力。以下的准则是自己一生的总结。准则一:“让我感到我的重要”几年前,我向劳伦斯学到一个信条,它成为我在人际
位于黄河泛区的周口地区味精厂,几年来连续翻番,在短短的6年内成为中国最大的味精生产厂家,产量、产值、税利等主要经济指标均居于全国同行业首位,创造了惊人的速度和辉煌的
介绍了一种基于神经网络的面向主题的元搜索引擎。它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的
从目标和内容两方面介绍日本基础教育中小学、初中、高中科学课程,期望为我国科学教育课程改革提供参考资料。
<正> 党的干部是党的路线的执行者。党的政治路线确定之后,关键是要看由什么样的干部来执行的问题。党的干部队伍的素质好不好,与党的路线能不能正确执行关系极大。因此,在贯