粗糙集理论在Web信息过滤中的应用研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:tianzhihen1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展极大地促进了信息的交流和沟通,人们可以共享丰富网络信息,在网上找到各种各样形形色色的信息。但同时,色情、暴力、邪教和其它有害信息通过互联网的传播也越来越猖獗,尤其互联网上淫秽色情内容已呈泛滥之势,如何防止不良信息在网上传播,保护网络安全,已成为当今网络安全技术中的一大热门课题。Web内容分析判别过滤是对用户浏览的网页内容进行综合分析判别。基于此项技术可望获得的内容判别准确率更高,又能避免数据库判别方式的弱点,无需经常性地更新数据库。目前对网页内容分析判别过滤的主要问题是在满足一定准确性的条件下如何提高过滤分析的快速性和实用性,这也是网络信息安全领域急待解决的关键技术之一。 基于规则的Web信息过滤技术易于理解,过滤速度快,适合处理大批量的文本过滤。本文提出一种利用粗糙集理论生成规则的Web信息过滤技术。通过对粗糙集理论的深入研究,阐明粗糙集理论是一种适用于不完整和不确定系统的知识发现的数学工具。在此基础上,本文深入研究了连续属性的离散化算法以及基于粗糙集理论的几种属性约简算法。 关于属性的离散化,主要讨论了Na(?)ve Scaler算法、Semi Na(?)ve Scaler算法和逻辑运算与Rough set理论相结合的离散化算法,并对几种离散化算法做了比较。发现针对不同的数据集,需要选用不同的离散化算法,选取不同的算法,会导致后面约简结果产生很大差异。 基于粗糙集理论的属性约简算法研究是本文的重点,文章主要讨论的约简算法包括:基于差别矩阵和逻辑运算的属性约简算法、回溯逻辑差别矩阵约简算法、改进的启发式属性约简算法。讨论了各种算法的优缺点,其中回溯逻辑差别矩阵约简算法和改进的启发式属性约简算法是本人在基本约简算法的基础上提出的改进算法。 将提出的启发式约简算法应用到Web信息过滤技术中是本文的一个创新点。首先提出Web信息过滤系统的粗糙集模型,然后通过属性的离散化处理模块得到
其他文献
  本论文的设计目标是采用SIGMADESIGN的多媒体嵌入式处理器EM8560开发出一套适用于安防、消费类电子、交通运输等应用领域的系统方案及其实现方法,同时,为了克服嵌入式系统
随着信息技术的发展,针对多媒体通信的需求有了显著增长.为了在通信中高效地存储和传输视频数据,必须要使用视频压缩技术.H.264标准进一步提高了视频编码压缩的效率,成为当今
本文提出了多种算法,仿真实现了信号特征提取、调制识别、参数估计和扩频信号检测。本文提出了基于频谱对称性的调制识别算法。利用频谱的对称性可以区分MFSK和MPSK/MQAM信号
随着数字可视化和网络技术的不断发展,医学图像信息在现代医学中的临床诊断、教学科研等方面的作用日益突现,相关技术和系统的研究已经成为当前数字图像研究领域中的一个热点
本论文首先介绍了我国目前的石油勘探现状,分析了发展地震波检波器测试系统的重要性和必要性;同时对嵌入式技术及其发展趋势进行了概括总结,论述了将嵌入式技术与地震波检波器测
在协作通信系统中,由于各协作中继节点是分散的,目的节点的接收信号在时间上是不同步的,所以,时延问题一直是协作通信研究中的主要问题。虽然,采用OFDM技术能够对抗协作系统中的时
受常州市音成电子有限公司委托,我们研制开发了基于小波变换的视频降噪系统。该系统以一般用户所使用的模拟电视信号作为信号源,使用解码芯片SAA7111A获取数字视频信号,利用FPGA
随着人们对信息的需求不断增长,高速率的通信系统亦随之飞速发展;速率的提高使得信号占用的带宽亦越来越宽;带宽的增加,带来了均衡技术的复杂化。在这种情况下,多载波调制技
本文研究了包括平方倍频检测、周期谱检测、时域相关检测和高阶统计量检测四种针对低信噪比下DS-SS/BPSK信号的检测与参数估计方法。平方倍频方法最初用于合作方间的DS-SS/BP
在无线通信链路中,空时编码技术可大大提高数据传输速率,酉差分空时编码作为空时编码技术的一个分支,以其不需任何信道信息的特点而得到广泛关注。本文简要介绍了空时编码的