基于多Agent系统的定题爬虫算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:t60720372f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定题爬虫的研究是定题搜索引擎的关键技术。该文提出一种基于多Agent系统的爬虫算法,采用本题语义主题关键词过滤的方法来抓取与主题相关的网页,利用本体库语义网络实现本体领域中同近义词的过滤。凭借HTML网页标记对关键字识别的不同权重和超链接锚文本对主题相关网页进行预测,通过黑板的通信机制实现多Agent交互。实验结果表明算法在抓取网页的查准率、查全率方面有一定的改善。
其他文献
针对模数多路数字采集系统的模拟量输入端口的特点,提出一种基于FPGA的自动测试设备的设计。该设备借助多通道电平设置数模转换器,可以实现高精度的测试。FPGA的可定制特性,可以
《国内投资项目不予免税的进口商品目录(2006年修订)》开始执行2007年3月1日,财政部公告的《国内投资项目不予免税的进口商品目录(2006年修订)》开始执行。《新的不免税目录》中
提出一种基于卷积码的彩色图像认证算法。对图像RGB颜色通道的高位比特进行卷积编码,把监督比特隐藏在低比特位中,实现对彩色图像的篡改检测和篡改定位,并保持编码后图像的不
<正>缑梦媛(本刊栏目主持):吴馆长,近年来"青年艺术家扶持计划"层出不穷,您也有所参与,对这类活动最明显的感受是什么?吴洪亮(北京画院副院长、北京画院美术馆馆长):早年我们
本文介绍<急性腹痛辅助诊断>专家系统的组成,系统知识的获取及表示模式,系统的推理规则及冲突的消解方法,系统与用户的接口方式以及自学习功能的设计.系统通过不断地学习,最
随着经济的发展,木质家具制造行业的发展也很迅速。但我国当前的木质家具制造企业大多数为中小企业,规模偏小,生产工艺水平较低,职业卫生管理薄弱,职业病防护设施不完善,作业场所存
复合冲模是指具有两个或两个以上型面的冲裁模。复合冲模在装配时要求各型面之间间隙均匀,合理调整各型面之间的间隙是装配的关键。