【摘 要】
:
针对页面特征提取实时性差的问题进行了研究,提出将特征分类,并行提取、检测、再融合结果的方法。首先提取三个类别的主要特征,包括文本、视觉和网络链接;然后分别利用贝叶斯算法、EMD算法以及网络爬虫来进行分类,并且基于后验概率来确定权值的最终选取;最后把这三个分类结果进行融合。通过对贝叶斯、加权和加权贝叶斯的比较,从正确率、漏报率和误报率对算法进行评估。实验表明采用加权贝叶斯的方法来进行融合计算效果最佳
【机 构】
:
南通大学电子信息学院,南通大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金资助项目(61202006),南通市科技计划资助项目(KB2012027)
论文部分内容阅读
针对页面特征提取实时性差的问题进行了研究,提出将特征分类,并行提取、检测、再融合结果的方法。首先提取三个类别的主要特征,包括文本、视觉和网络链接;然后分别利用贝叶斯算法、EMD算法以及网络爬虫来进行分类,并且基于后验概率来确定权值的最终选取;最后把这三个分类结果进行融合。通过对贝叶斯、加权和加权贝叶斯的比较,从正确率、漏报率和误报率对算法进行评估。实验表明采用加权贝叶斯的方法来进行融合计算效果最佳,具有较高的准确率和较低的误报率和漏报率,提高了检测的精度和实时性。
其他文献
为提高网络吞吐量、缓解交通拥塞程度,结合复杂网络理论和引力场理论研究了在交通引力场下的动态路由选择过程,定义了传输路径对数据包的引力计算公式。基于路径的引力,顾及数据包的传输路径长度、节点畅通度及介数对传输过程的影响,提出了一种在介数约束下的引力场路由选择策略,并引入参数μ用于调节路由过程对节点介数的控制强度。为描述数据包传输过程的有效性,引入有序参数η,利用其由自由流到拥塞态的指标流量相变值度量
按照时空数据模型对时间和空间的表达方式,将时空数据模型分为基于时间的时空数据模型和基于空间的时空数据模型。提出了一种新的基于时空数据预测用户社交联系的模型,该模型将基于时间的时空数据集的特征和基于空间的时空数据集的特征进行融合来预测用户社交联系。实验结果表明基于时间与空间特征融合的时空数据模型能更好地预测用户的社交联系。
量子纠缠的判定问题(也称为可分性判定问题)是量子纠缠理论中的核心问题之一。越来越多的两体纠缠判定准则被提出,但其中大部分都难以理解和计算,或是难以应用到任意多体量子系统中。为此,对于一个任意的多体量子纯态,基于其系数矩阵提出了一个纠缠判定准则。通过考察一个量子态的系数矩阵的秩,就可以断定该状态是可分态还是纠缠态。通过具体的实例表明,所提出的方法可以找到一个多体量子态的具体可分形式,并且简单易懂、方
有限域GF(2m)上点乘运算是影响椭圆曲线密码实现效率的关键运算之一。为提高椭圆曲线密码算法计算的安全性和效率性,从分析固定基点梳形(fixed-base comb)算法的特点出发,在现有的边信道攻击和标量乘算法的基础上,提出了一种新的标量乘算法——DF-Comb(distance fixed-base comb)算法。新的算法对私钥(k)重新设计编码、分组计算,在预计算阶段和赋值阶段进行改进,能
由于云存储中用户对数据失去了控制,所以云存储存在低可用性和隐私泄露等严重的安全问题。为提高数据可用性,根据已有的冗余技术——Z code,提出Zcode,一个新的云数据精确修复方案。首先对数据进行隐藏与编码,再将编码数据在多个云上进行分布存储。通过实验和分析,Zcode修复一块隐藏数据块所花费的时间与Z code相差无几,而修复一块冗余块的时间比它们修复数据块的时间都要少。一方面,它能够保证数据隐
能量空洞是影响无线传感器网络性能的关键问题之一,据此提出了一种基于能量迭代的非均匀分簇路由算法。该算法在簇头选举时通过减少迭代次数,降低能量消耗,同时综合考虑节点能耗速度、节点到汇聚节点的距离等因素,选出最优簇头。考虑到节点到汇聚节点距离和节点密度对网络生命周期的影响,提出了非均匀分簇算法,实现网络能耗均衡的目的。仿真实验表明,当最大簇半径为R=50 m,选举因素所占权重α=0.4,簇半径调节系数
现存软件定义网络中的流量工程算法考虑单一,难以实现流量均衡,且缺乏对端到端的时延优化。对此提出一种博弈混合路由算法,以少量的显式路由与基于目的的聚合流量配置,在保证流量均衡的同时,优化网络的平均端对端时延。聚合流量配置采用纳什议价博弈理论对流量均衡与端对端时延优化场景进行联合优化建模,并设计了相应的启发式算法进行求解。实验结果表明,与现有算法相比,流量均衡程度和平均端对端时延均得到一定程度的改善,
如何高效、安全地分发新的组密钥是广播加密研究的重点。经典的完全子树(complete subtree,CS)协议通信开销较大;而排外完全子树(exclusive complete subtree,ECS)协议则具有常量的通信开销,但是ECS协议仅抵抗单用户的攻击。结合ECS协议具有常量通信开销和CS协议完全抗合谋攻击的特点,设计并实现了一种混合结构的广播加密方案,该方案牺牲了较小的抗合谋攻击能力,
针对多天线蜂窝网络下行干扰信道,利用级联预编码思想和以干扰对齐为用户调度准则的随机波束赋形方法,提出了一种机会式干扰对齐算法。在基站与被选中用户的下行链路中,双层
针对云服务组合的策略冲突问题,研究了云服务中属性间关系及组件服务间组合关系的特点,提出了基本类型冲突、层次关系冲突、互斥关系冲突、组合关系约束冲突四种冲突类型;设计了能够直观表达策略中多种关系的策略生成图模型,该模型具有结构灵活、易于更新和动态扩展的优点;将冲突检测问题转换为图的连通性问题,提出了一种基于策略生成图模型的冲突检测机制,实现了对云环境下大规模策略集中冲突策略的高效检测。最后,开展仿真