中文网页分布式并行索引的设计与实现

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:xiaomay2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet搜索引擎主要由搜索器、索引器和用户界面三部分组成。通过分析索引数据库在搜索引擎时效性及有效性方面的重要作用,提出一种多进程并行分词建立索引的方法。以中文网页数据库为基本语料库,采用正向最大匹配法进行中文分词,并用一种高效的倒排索引方式存储索引表。这种方法能够加快索引建立与更新的速度,并且在空间效率上也有较大的提高。
其他文献
导航定位问题是自主式水下机器人研究(AUV)的主要内容之一,本文针对一种开架式AUV设计了一种采用间接反馈校正的捷联惯性导航与GPS、罗盘相组合的导航方案,其中采用卡尔曼滤波器接收两套导航子系统对同一导航参数输出值的差值,经过滤波计算估计出各误差量。仿真实验的结果表明,SINS/GPS/COMPASS组合导航对SINS误差随时间不断加大的现象起到了很好的抑制作用,能够满足AUV定位精度的要求。
鲁迅的小说不仅具有很高的认识价值,而且极具审美价值。鲁迅以自己独特的审美方式,将自己炽热的情感燃烧在作品里,将爱憎熔铸在形象的刻画中,感染人、教育人,能激起人们对真、善、
本文从心理学角度了解电大学员心里特点并与学习活动的特点相链接,分析出电大学员的学习活动与普通全日制学生相比有其特殊性。为使电大学员的教学机制得以更加完善,提高电大学
在企业外向型发展过程中,以汇率风险和融资风险为代表的金融风险是最为普遍的风险。宁波是我国重要的外向型城市,但外向型企业的主体是中小型民营经济,总体规模小、实力弱、
视频分析的核心是对语义事件及其相互关系的分析,其主要任务是解决底层特征和高层语义之间的"语义鸿沟"。文中研究了基于动态贝叶斯网络的体育视频分析。首先,将视频流分解为一个个组成语义事件的底层基元,然后通过Kalman滤波原理提取图像特征,并运用EM算法完成DBN参数学习。实验结果证明了本文方法的有效性。
目的探讨综合护理对慢性肾炎合并抑郁患者心理状况的影响。方法将我院2018年10月至2020年10月收治的60例慢性肾炎合并抑郁患者,根据随机数字表法分为对照组与试验组,每组30例
介绍了ACP100发生选址假想事故后,对非居住区边界剂量环境影响的评估方法。基于RG 1.183建立了ACP100选址假想事故后释放到环境的源项计算模型,并结合厂址的气象条件采用PAVA
书牍文完全脱离公牍的性质,而成为个人交流思想感情、互相交往的工具,当始于汉代。“书”是古代书信的总名,因书写的材料和规制的不同称谓种种,书牍很早就成为我国古代文章中的重
职业学校教育方法创新是学校生存和发展的必然要求,对为社会培养高素质技能人才具有十分重要的现实意义。农村职业学校教育创新必须紧随时代教育发展主题,积极研究和深化教育方
保护投资者权益是推进资本市场基础制度改革的重点方向。长期以来,证券虚假陈述民事诉讼前置条件给投资者寻求司法救济设置了巨大的阻碍。为了更好地保护投资者利益和顺应改