巧用黑盒法逆推百度中文分词算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:wwfkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术。笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象。介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法——正向最大匹配分词算法。该算法是最常见的一种中文分词算法,比较符合人的思维习惯。了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进。
其他文献
目的:观察中药封包配合神灯照射治疗早中期膝骨关节炎的临床疗效和安全性。方法:2016年6月-2018年6月,我们采用中药封包配合神灯照射治疗早中期膝骨关节炎93例,连续治疗4周。
本文通过对我国高职高专发展历程的回顾,分析了当前高职高专教育的中心任务与面临的主要问题,阐述了高职高专教学改革的紧迫性,重点对计算机应用与软件技术人才的社会需求、
目的:探讨中药复方养肝活血汤对大鼠酒精性肝病(Alcoholic Liver Disease,ALD,简称酒精肝)的作用及其机制。方法:构建大鼠酒精肝模型,并检测不同组别中(空白对照组,模型对照
目的:探讨茵栀黄汤联合双歧杆菌三联活菌治疗新生儿黄疸临床应用价值。方法:随机抽取我院于2017年1月-2018年1月期间收治的400例新生儿黄疸患儿,依据治疗方案分为对照组(常规
目的:观察综合护理疗法治疗小儿过敏性鼻炎的护理效果及临床疗效,为避免治疗前后护理不当造成的不良反应、疗效欠佳、病情加重、容易复发等问题提供一套全面的护理方案。方法
目的:探讨N-乙酰半胱氨酸联合沙美特罗替卡松粉吸入剂治疗稳定期慢性阻塞性肺疾病的临床效果。方法:选择中国人民解放军南部战区海军第一医院100例2017年6月-2018年5月稳定期