基于粒计算的异常点检测算法研究及应用

来源 :华北理工大学 | 被引量 : 0次 | 上传用户:a7343022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常点检测是目前数据挖掘领域中极为重要的研究内容。异常数据是指与数据集中大部分数据行为模式不同的数据。异常点检测通常用于在预处理中删除数据集的异常数据,在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。因此,研究高效的异常点检测算法对后续数据挖掘至关重要。目前,对异常点检测的研究主要包括基于统计学、聚类、分类以及最近邻等方法。但已有算法大多存在参数选取敏感、耗时长、属性考虑不全等不足。粒计算是一种多层次、多视角的问题求解方法,因此,论文将粒计算思想融入异常点检测领域,提出多粒度数据异常点检测算法。主要贡献如下:1.为了考虑数据的近邻分布,通过近邻分布密度引入离群指数的概念,并结合多粒度思想提出箱形图结合离群指数的多粒度异常点检测算法,进一步在房价预测领域验证算法性能。2.针对已有算法参数选取敏感,耗时长等问题,将控制图思想与粒计算思想融合提出基于Xm R控制图的多粒度异常点检测算法。该算法使用单值—移动极差控制图(Xm R控制图)从不同视角对数据集中每个单粒度构建X图和m R图,从而挖掘图中异常点。3.将基于XmR控制图的多粒度异常点检测算法应用于软件缺陷检测领域,通过与七种异常点检测算法(隔离森林、LOF、OCSVM、COF、CBLOF、HBOS和KNN)进行对比,验证算法的优越性。论文提出两种基于粒计算的数据异常点检测算法,并采用不同评价指标的均值与标准差验证算法的有效性。图34幅;表26个;参69篇。
其他文献
目的设计合成新颖的多环笼状骨架——二氮杂四环十二烷衍生物(Ⅱ),运用分子对接技术和生物活性测定评估小分子与靶蛋白的结合能力及体外活性,以期得到具备拮抗N-甲基-D-天冬氨酸受体活性的化合物。方法基于研究者对多环笼状药物的研究思路,设计了一种新颖的多环笼状结构(Ⅱ),运用分子对接技术对其受体-配体结合能力进行评估,通过筛选研究,得到拟合成的目标化合物结构。以3-氰基-1,4-二氢吡啶作为光反应底物,
学位
目的纳米药物递送系统是由纳米粒子和药物组成的复合体系。其中介孔二氧化硅纳米粒子由于其良好的稳定性和高载药性能,广泛应用于药物递送系统。但是,研究发现单纯的介孔二氧化硅在药物输送过程中容易发生泄露现象,且缺乏特异性。因此开发刺激响应型介孔硅基药物载体显得尤为重要。方法1光响应型介孔硅基药物载体:首先通过溶胶-凝胶法制备出介孔二氧化硅纳米粒(MSN);随后利用嫁接法在MSN表面依次修饰3-氨丙基三乙氧
学位
偏微分方程是现代数学的重要组成部分,其在近代物理学、生物学、流体力学等学科中都有广泛的应用。其中,A-调和方程作为经典调和方程的推广,得到了深入的研究,并取得了很多重要的成果。这些研究成果对自然科学和工程技术等领域具有重要的理论和应用价值。文章研究A-调和方程的很弱解的性质,对方程的很弱解进行梯度估计以及对方程对应的障碍问题的很弱解进行梯度估计。全文共分为四章,各章节内容组织如下:第一章主要简述选
学位
目的为了得到具有高增殖能力和高细胞毒性的免疫细胞,将双功能抗体(Bispecific antibody,Bs Ab)和饲养细胞引入到传统的CIKs细胞培养系统,以提高这些体外扩增的免疫细胞的增殖能力和细胞毒性。并将使用该种方法扩增得到的细胞命名为双功能抗体激活T细胞(Bispecific antibody activated T cells,BAATs)。方法1细胞体外制备培养:通过加入双功能抗体
学位
随着水环境日益恶化,水中氟污染日益加剧,长期饮用氟含量超标的水容易引起氟斑牙、氟骨病等一系列疾病,氟污染已成为世界公认的主要问题之一。混凝沉淀法是最经济有效的除氟方法,采用传统絮凝剂在含氟水处理过程中存在絮凝剂用量大、产生污泥多等问题,因此研究一种高效的除氟絮凝剂势在必行。以硅酸钠、氯化铝、氯化钙为原料采用复合共聚法制备聚合硅酸铝钙(PSAC)絮凝剂,剩余F-浓度作为评价指标,通过单因素和正交试验
学位
基于用户的协同过滤推荐通过收集和分析与用户行为相关的历史数据,并基于与其他用户的相似性实现对用户的推荐,而用户的历史行为数据集存在严重的稀疏性,从而降低推荐的准确性。K-means聚类和模糊C-means聚类降低了稀疏数据的影响,但推荐的多样性效果并不明显,将粒层聚类融入协同过滤推荐不仅能解决算法对稀疏数据的敏感,同时也能实现多样性推荐。粒计算是使复杂问题简单化的一种计算工具,通过合适粒度的选择,
学位
报纸
云是地-气系统的重要组成部分,云宏观特征不仅与地-气系统的辐射收支及区域气候变化密切相关,还直接影响云降水过程模式预报的准确性,鉴于此本文基于2020年8月至2021年7月呼和浩特地区毫米波云雷达观测数据,对黄河流域内蒙古段云出现频率及垂直结构进行统计分析。结果表明:该地区多以晴空为主,全年晴空廓线超过了云雷达总采样廓线的70.00%,相比而言,云出现频率较小,6月最高值也仅为43.84%。云类型
期刊
<正> 亚麻籽经榨油后的副产物为亚麻饼。亚麻饼营养成分为:粗蛋白30.61%,粗脂肪9.10%,粗纤维7.60%,水份7.86%,灰份19.99%,钙0.66%,磷1.07%,无氮浸出物24.84%。亚麻饼中含有亚麻配糖体与亚麻酶,亚麻酶在水中作用时能促进亚麻配糖体分解生成有毒物质氢氰酸。氢氰酸的存在降低(限制)了亚麻饼的使用价值。近年来有人用药物方法对亚麻饼进行脱毒,但操作麻烦,同时也增加了亚麻
期刊
医学影像一直是临床诊断中的重要依据,随着计算机硬件和软件技术的飞速发展,包含着各种不同信息的医学图像不断涌现。在设备采集图像过程中,由于环境、设备角度和患者的移动等因素,经常会造成医学图像的线性与非线性形变。其中非刚性配准技术主要针对图像像素点进行非线性的位置变换,可以很好地解决图像的非线性变形。将非张量积型B样条理论应用到医学图像领域,提出了新的非刚性配准算法。主要完成了以下工作:1)建立了一种
学位