基于主题与语义的作弊网页检测方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:ll13813568876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页作弊检测可以被看作二元分类问题。当前基于内容的作弊网页检测方法主要使用统计特征,不能准确识别隐藏的作弊手段。为此,提出一种改进的作弊网页检测方法,使用语义与统计两类特征,将作弊检测深入至主题层次。该方法对网页内容进行主题建模,将网页内容映射至主题空间,根据其主题分布进行语义分析计算,从中提取语义特征,结合统计特征对网页进行分类检测。实验结果表明,该方法在精确率、召回率与F1测度上均获得了较好的效果。
其他文献
目的探讨微流控环介导等温扩增法在脓毒症患者肺炎克雷伯菌检测中的应用价值。方法收集2015年7月~2018年5月河北北方学院附属第一医院重症医学科脓毒症患者152例作为研究对象
目的探讨肛裂切除术与纵切横缝术治疗肛裂患者的临床疗效。方法选取2012年1月~2014年1月在我院治疗的60例肛裂患者作为研究对象,根据患者意愿和临床需要,对32例患者采用肛裂
以金属钠、月桂醇及3-氯-2-羟基丙基三乙基氯化铵(CTA)为原料,反应得到阳离子表面活性剂3-烷氧基-2-羟基丙基三乙基氯化铵(DPAC)。通过正交实验确定最佳合成工艺条件为:四氢呋喃为
目的探讨对接受手术治疗的老年结直肠癌患者进行综合护理干预的效果。方法将2013年1月至2015年3月在我院进行手术治疗的80例老年结直肠癌患者采用随机数表法分为观察组与对照
对常见的混合模型进行了推广,提出了异分布混合模型的概念.以二项分布和泊松分布为例,详细给出了异分布混合模型的数学定义,以及异分布混合模型参数的贝叶斯估计.在参数估计中,选择
以达西公式与海曾威廉公式分别对不同管径及不同流速情况下PVC-U输水管道的沿程水头损失进行计算,通过计算结果的对比分析,得出不同管径及不同流速条件下的适宜的沿程水头损
小学数学实践活动课程融合了学科性、综合性、实践性为一体,可以体现数学综合实践应用的价值.开展小学数学实践活动课的目的在于帮助学生进一步综合应用所学的数学知识,提高
文章分析当今世界处于百年未有之大变局的背景和特征,指出以美国为首的西方势力亡我之心不死的新动向及在新闻舆论阵线的新手法。解读第103届普利策新闻奖和我国设立媒体监管
目前国内规范推荐的计算镀锌钢管沿程水头损失的公式包括舍维列夫公式和海澄-威廉公式,但其计算结果之间存在较大差异。通过试验分析探讨了舍维列夫公式和海澄-威廉公式用于镀
高速视觉成像技术能够将某一瞬间事物的变化历程以图像的方式记录下来,在国防科技、科学研究、生物医疗等领域均有广泛应用。成像装置性能受图像传感器像素结构、读出噪声和