基于邻域粗糙集的度量方法及其应用研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:hubeibei1919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今科技飞速发展的时代,人工智能成为核心领域之一,机器学习和数据挖掘逐渐影响着人们的生活,很多科技产品都是在此基础上的应用与研究,如指纹或人脸识别考勤设备、汽车无人驾驶、高级智能化机器人等新技术,这些利用信息科技推动发展的新技术使人们的生活和工作变得更加方便和高效。在众多的领域中,聚类分析是一类重要的应用技术,将粗糙集应用在聚类分析上也是当前研究的热点领域。本文首先对常用的度量方法进行介绍和总结,分析了不同度量方法的优势特点以及应用领域。针对已存在度量方法的不足,结合邻域粗糙集理论的思想,提出了基于邻域粗糙集理论的度量方法,同时对该方法的特性、背景以及应用场景进行深入的分析。本文将该度量方法应用在智能算法以及聚类分析上,提高了原始算法的性能。本文的主要工作如下:(1)提出了邻域粗糙集度量方法。首先,通过邻域粗糙集理论介绍了已有的度量方法。然后,利用邻域粗糙集中的近似集得到近似精度以及近似分类质量,通过近似精度、近似分类质量求出重要度、粗糙度从而提出邻域粗糙集度量方法。最后,通过实验得出该度量方法能够得到较好的结果。(2)将提出的基于邻域粗糙集理论的度量方法应用在粒子群聚类算法上,并利用大量实验进行验证。首先,对各种改进的度量方法进行分析和总结,挑选出具有代表性的度量方法进行对比。然后,在真实数据集和人工数据集上,针对不同的聚类评价指标和不同的度量方法进行实验。最后,分别在两方面对聚类结果进行比较分析,包括不同算法使用相同的度量方法和相同的算法使用不同的度量方法。(3)将提出的方法应用在密度峰值聚类算法上。首先,对该度量方法应用的背景以及应用场景进行研究分析。其次,详细分析了 DPC算法存在的缺陷,即:DPC中的方法使用清晰的邻域关系来计算局部密度时,不能从距离上识别出不同点的邻域隶属度,另外对不平衡数据以及多峰值数据进行聚类时得不到理想的结果。最后,将具有代表性的数据集利用不同的聚类评测标准进行实验。
其他文献
计算思维作为灵活运用工具、分析解决问题的思维方式,顺应我国创新驱动的发展需求,成为21世纪必备技能之一。计算思维和编程密切相关,然而目前的编程教育仍存在诸多问题。游戏化学习的引入解决了编程中的众多难题,因此本研究将游戏化编程教育应用到中学生的计算思维培养研究。首先梳理计算思维和游戏化编程文献,对其研究现状进行研读,分析目前计算思维的概念、方法以及游戏化教学模式、原则。其次以文献综述为基础,将分解、
随着互联网中流量激增和新业务的不断涌现,现有网络技术已难以满足工业物联网、5G移动通信、AR/VR音视频和智慧城市等新应用场景中对实时性和可靠性的要求。面对这种时间敏感性业务的急切需求,如何保证可靠性,准确控制端到端时延成为热点问题。鉴于其成本低、部署简单、产业链成熟且带宽不断增大,以太网技术在新一代传输和接入网络中被广泛使用。因此,出现了多种改善以太网“尽力而为”机制引起的分组丢失和不确定性等问
序列密码的设计思想正在从线性序列变换到非线性序列,与此同时涌现了很多性质良好的非线性部件。进位反馈移位寄存器(FCSR)由于自带非线性,类似于LFSR的代数结构,具备优良的密码学性能,被认为是LFSR的一个较好的替代。在研究FCSR的结构和生成序列的同时,基于FCSR设计的各种新型序列密码开始出现,催生了各种针对FCSR类密码的分析技术与攻击手段,这反过来促进了FCSR理论与结构的进一步完善。本文
近年来,随着传统媒体不断向数字化转型,数字媒体内容逐渐成为互联网的主体。然而,大量的数字媒体内容中只有少部分是真正热门的,这就需要及时而有效的热度预测算法来甄别热门
随着信息技术的蓬勃发展,集成电路集成度不断提高,器件的特征尺寸不断缩小,传统的非挥发性存储器正面临着发展瓶颈:不断缩小的器件尺寸使得浮栅的厚度相应减小,然而过薄的栅
软件安全漏洞问题是当前网络空间安全的重要研究方向之一,软件安全漏洞一旦被恶意攻击,会导致用户的财产损失和信息泄露。模糊测试(Fuzzing)技术作为一种自动化的软件漏洞动态检测技术,因其在漏洞发掘方面的高效性和易用性,近些年获得了很大关注。将Fuzzing测试技术与符号执行、静态分析等其他程序分析技术相结合来提高Fuzzing测试的效率,成为了目前的一个研究热点。论文主要研究以一种更有效、更高效的
随着人类社会发展,贫穷和人类社会历史相伴而生。社会救助作为整个社会保障体系中最古老的一项制度,几千年以前,我国政府通过为社会中的贫困者和其所在的贫困家庭提供帮助的
中文分词是自然语言处理中的基石,由于中文在文本中的特殊性,它并不像英文一样有明显的空格分隔开,而是以单个字为单位,因此如果需要从文本中获取有用的信息,一定需要有正确分词后的文本,才能更好地进行下一步的自然语言处理方面的工作。然而中文分词的两大难点——真歧义以及未登录词,至今仍旧没有很好地解决。面对网络上用户的复杂信息,作为命名实体识别中必不可少的一部分,用户标识识别就可以发挥其作用。序列标注模型在
数据挖掘是一个从大量、复杂且冗余的数据中利用先进且精确的技术挖掘并产生新知识的过程,目的是寻找数据间潜在的关联,为研究者提供有利的科学指导依据。聚类算法是数据挖掘领域的一种重要的无监督算法,旨在找寻数据内在的分布结构,以便做进一步的数据分析。目前在许多研究领域都有较为广泛的应用,包括模式识别、信息检索、神经网络、图像处理等。本文对聚类算法进行了深入的研究,提出三种新的无参数峰值聚类算法:1.提出了
伴随着近些年来移动互联网以及移动支付的蓬勃发展,移动终端自身所蕴含的价值日益增多。由于巨大黑灰色利益驱动,恶意攻击者开始尝试入侵移动终端并进行盗用,在面对层出不穷的恶意入侵方法的情况下,如何对用户进行身份认证成为了保护用户财产的重要研究内容。当前对手指操作行为的身份认证的研究,大多数针对的是用户触碰屏幕时的过程,通过对用户触碰屏幕瞬间产生的行为数据进行特征提取,并使用各类检测算法进行比对或分类。因