大豆主题网页资源采集系统的研究

来源 :农机化研究 | 被引量 : 0次 | 上传用户:czq8068
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
农业专业搜索引擎对特定主题的农业信息进行检索,其信息量多、精确度低。针对此现状,以开源搜索引擎Nutch为技术框架,对大豆主题网页资源采集系统进行了研究与设计。以大豆信息为主题,研究了主题相关度判别技术,借鉴BM25F模型的分域思想、基于向量空间模型,提出了大豆主题相关度判别算法。在Nutch中引入IKAnalyzer中文分词工具包,实现了大豆主题相关度的判别。实验结果表明,该算法能够显著地提高大豆主题网页资源采集的准确率。
其他文献
采用无水AlCl3作为催化剂进行桥式四氢双环戊二烯(endo~THDCPD)的异构化反应,采用气相色谱对反应原料、产物及杂质进行定量分析,考察催化剂含量、反应温度对反应速率、反应转
通过试验分析热风温度、热风速度和切片厚度对经过95℃热水漂烫处理的西葫芦切片热风干燥特性的影响,得到西葫芦干燥曲线和干燥速率曲线。将干燥所得的西葫芦切片进行复水试
来自慕尼黑的设计公司Designliga成立于2001年,主要承接视觉传达和室内设计项目,最近他们完成了奥迪quattro品牌在阿尔卑斯山Festkogl牧场旁的旗舰店设计。这座木屋位于海拔265