网页自动分类融合模型研究

来源 :数字图书馆论坛 | 被引量 : 0次 | 上传用户:xdhjyinghua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高网页自动分类的准确率,基于信息融合的模型理论,提出了一种通用的网页自动分类模型和融合算法。该模型根据完成功能的不同分为四个层次:信息抽取层、数据预处理层、特征层和决策层,其中特征层是针对网页上不同种类的媒体信息采用不同的分类方法进行分类,并将分类结果分别输入决策层和与该特征层算法相关的其他的特征层。决策层是处理特征层的分类结果,并推导出最终的网页分类融合结果,并将该模型和算法进行了实现。实验表明,文章提出的融合模型和算法可以有效地改进网页自动分类准确率。
其他文献
DRM既是内容流通领域的重要技术,也是确保同时满足内容的创作者、提供商、用户等不同角色需求这一复杂流通环境的必要技术。DRM的应用会部分妨碍用户获取内容,但因不当拷贝内容
结实率低是影响向日葵产量的一个重要因素。本文根据新疆特有的环境条件,从温度、水肥、土壤及种植密度等方面对向日葵结实率低的因素进行总结,以为向日葵高产栽培提供理论依
基于网络描述的复杂社会结构能够更好地展示网络中个体的联系特征,由此产生的复杂网络理论已经被广泛应用到社会科学的各个领域。近年来,除了对网络结构所具有的小世界、幂率分
在分析城市公交站点布设模型的基础上,结合车辆配置限制模型和乘客总出行时间最小站距模型的特点,运用系统总成本最小理论建立了公交站点优化的数学模型,该方法原理简单、便
我大抵记得十二岁那年的事,我们家突然门庭若市。在那些行色匆匆的人之中,就有我的小姨父秦大贵。他们像是从一列叫作忧伤的火车上一起下来的一样,均哭丧着脸,说话的声音要么
北京市中医管理局于2016年启动了中医护理传承工作,中国中医科学院广安门医院申请成立了"王敏中医护理传承工作室",经过为期三年的建设,积累了一定的经验。本文从"王敏中医护
Master-apprentice system is a main mode of talent cultivation for Traditional Chinese medicine(TCM). To vigorously push forward inheritance and innovation of TC
<正> 美国安然公司曾是世界上最大的天然气交易商和最大的电力交易商。但是,安然公司不仅是美国历史上崩溃的最大的企业之一,也是崩溃速度最快的一个。2001年9月似乎还是一家
<正>在行业回归"保险姓保"的背景下,近年来实现快速发展的健康险业务成为身处转型过程中的众多保险公司瞄准的一片新"蓝海"。在刚刚过去的2018年,健康险业务继续保持着良好的
互联网的普及、学术出版的电子化和电子资源的海量化以及搜索引擎的“无所不能”,学术文献以纸张和磁盘两种载体并行传播,我们处在纸质文献和电子文献并行的时代。这导致了读者