【摘 要】
:
针对网页分类中关联分类方法存在的如下两点不足:(1)仅把网页当成纯文本处理,忽略了网页的标签信息,(2)仅用网页中的特征词作为关联规则的项,没有考虑特征词的权重,或仅以词
【机 构】
:
江苏大学计算机科学与通信工程学院,南通大学计算机科学与技术学院
论文部分内容阅读
针对网页分类中关联分类方法存在的如下两点不足:(1)仅把网页当成纯文本处理,忽略了网页的标签信息,(2)仅用网页中的特征词作为关联规则的项,没有考虑特征词的权重,或仅以词频来量化权重,忽略了特征词位置特征的影响,提出了基于特征词复合权重的关联网页分类方法。该方法利用网页标签信息所体现的位置特征计算特征词的复合权重,并以此权重为基础建立分类规则,对网页进行分类。实验结果表明,该方法取得了比传统的关联分类方法更好的效果。
其他文献
针对当前研讨厅中对专家大段发言缺乏归纳、概括方法的问题,提出了一种面向研讨环境的摘要生成方法,该方法采用概率混合模型抽取专家发言的话题集,对相邻话题的变化情况进行
在现有的AQM算法的基础上,使用经典控制理论中的时域分析方法对ARED算法的内部结构进行分析研究,根据分析的结果设计了新的基于二阶差分的离散控制器,并将其应用到AQM算法中
移动代理是一种软件程序,被认为在未来的电子商务中将起到很重要的作用。但安全问题一直是移动代理得到实际应用的一个很大障碍。对已有的移动代理路由协议进行了分析讨论,在
KRA表示模型给出了对物理世界W进行形式化建模的一般框架。在扩展后的广义KRA模型中引入本体概念,将抽象对象库扩展为本体类,在本体类中实现KRA模型框架中的感知层、语言层和
针对面向高度动态移动对象集的多用户连续K近邻查询,提出了基于查询索引的多用户连续K近邻查询处理(Query Index based Multiple Continuous K-Nearest Neighbor Queries,QI-M
近年来,网络编码以其巧妙的思想展现出生机勃勃的应用前景,但是安全问题一直是其在网络中大规模应用的最大障碍。在现有研究成果上,从网络编码的基本原理出发,按照物理层和网
互联网技术的高速发展,引起了人类工作方式的巨大改变。机场工作人员急需自动化、智能化的工作平台来满足乘客对服务效率的需求。本文主要介绍工作流引擎jbpm5,并且就具备高