若干密度聚类的改进方法及其在股票评估中的应用

来源 :吉林财经大学 | 被引量 : 0次 | 上传用户:tianbentb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,人类社会逐渐从工业化时代过渡到信息化时代,挖掘信息中隐藏的价值成为学术界的研究重点。聚类技术作为数据挖掘的重要工具,能够从海量数据中获取有价值的信息,因此成为当下人工智能领域的研究热点。目前,密度峰值聚类(Density Peaks Clustering,DPC)算法和基于密度带有噪声的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法作为无监督学习类算法,在聚类技术中占有重要地位。然而,这两种算法在聚类性能上仍然具有一定的局限性:(1)DPC算法不能准确识别异常点,总是将异常点归类到簇类中;(2)DPC算法在处理非凸数据集时表现不佳;(3)DPC算法需要手动选取聚类中心点,对算法的客观性和准确性产生负面影响;(4)DBSCAN算法需要人工选取距离阈值Eps,降低了聚类结果的准确性。针对上述问题,本文提出相应的改进方案并将改进后算法应用于股票评估中:(1)针对密度峰值聚类算法不能准确识别异常点以及对非凸数据集聚类效果不佳的问题,提出一种基于基尼系数的密度峰值聚类(A Novel Gini Index-based Density Peaks Clustering,GIDPC)算法。该算法引入基尼系数思想原理重新定义数据点的局部密度计算方式,为聚类中心的识别提供了更好的决策图,同时设定合理的异常点识别阈值以及异常点分配方式,实现对包含各种数据分布模式的数据集的更好处理。然而,该算法继承了DPC算法需要手动选取聚类中心点的缺陷。(2)针对基于密度带有噪声的空间聚类算法需要人工选取距离阈值Eps的问题,提出一种基于鸟群优化的自适应密度带有噪声的空间聚类(A Novel Adaptive Density-Based Spatial Clustering of Applications with Noise Based on Bird Swarm Optimization,BSA-DBSCAN)算法。该算法通过利用鸟群优化算法的全局搜索能力自适应扫描参数空间,输出最佳距离阈值Eps,实现参数选取的自适应。(3)针对GIDPC算法需要手动选取聚类中心点的问题,提出二阶段集成自动聚类(Two-Stage Integrated Automatic Clustering,TSIAC)算法。该算法利用BSA-DBSCAN算法在输入合适的参数值时能够自动获取数据集真实簇类数目的能力,为GIDPC算法选取聚类中心提供依据。同时引入聚类中心自动选取机制,无需手动选取聚类中心,即可输出聚类结果,实现算法的自动聚类。(4)最后,拓展本文改进算法的应用领域,将改进算法应用于股票成长能力评估中。实验结果表明,改进后的算法能够依据股票特征较精确地对股票进行聚类,以评估股票情况,为股票投资者提供了有价值的参考,在实际应用领域具有一定的潜力。
其他文献
作为一个年轻的,迅速崛起的证券市场,中国证券市场保持高速发展了30年,并迅速成长壮大起来。但与已有200年历史的国外证券相比,中国证券仍处于起步阶段。在全球经济一体化进程中,中国经济快速发展,证券业面临着不断更新、迭代、竞争更加激烈的环境。由于当今非常低的交易成本和大数据分析方法使客户更容易选择和转换,因此证券公司面临着新的机遇和挑战。每一家证券企业都必须清楚的了解自己优劣势,认真分析重点客户需求
《1844年经济学哲学手稿》是马克思基于欧洲社会现状对国民经济学进行批判性思考,对黑格尔哲学、费尔巴哈哲学进行辩证吸收而进行的早期创作,为马克思思想后来的形成与发展奠定了坚实基础,具有重要的时代价值。文中从理论价值、实践意义、现实意义三个维度,分析《手稿》对西方哲学思想进行的批判与辨思、对共产主义进行的思考与构想、对现实社会中“苦恼的疑问”的回应、为工人运动提供的思想指引、对当时社会经济发展状况的
<正>近年来,国药集团在迈向世界一流企业的路上取得令人瞩目的成绩。2021年,国药集团营收和利润均创造了新的纪录,营收首次突破7000亿元大关,首次进入千亿元利润俱乐部。成绩背后潜藏着的是“国药人”多年来的积淀和耕耘。国药集团党委书记、董事长刘敬桢在接受《国资报告》独家专访时表示:“在全球经济形势日趋复杂、竞争不断加剧的大背景下,我们‘国药人’迎难而上,主动作为,敢于接招,善于出招,
期刊
导数是反映函数局部性质的工具,在高中数学中是一个特别的存在,它对解不等式、函数以及恒成立问题等均有重要作用,是不可或缺的一个工具.导数的应用广泛,主要运用其几何意义表示斜率,以及研究函数的单调性、极值,最值等问题.不仅如此,导数常与其他知识点结合进行考查,是得高分必须掌握的知识点.本文将详谈导数在高中数学中的应用,以期帮助学生整理规律,总结经验.
贵州安顺地区的屯堡是黔中地区典型的地域聚落类型之一,其是明代江南汉族移民在黔中喀斯特地理文化单元中构筑而成的军事防御型传统聚落。在六百余年的封闭发展中,安顺屯堡人坚守江南汉族文化基底,并充分适应、融合当地自然地理环境,在黔中大地创造出别具一格的屯堡聚落文化景观,是中国地域文化景观中的瑰宝。但随着农村城镇化进程的加速,现代信息社会对于屯堡聚落的冲击愈演愈烈,其自身所具有的传统文化逐渐为现代文化所同化
整体法与隔离法是分析物理问题的常用方法,整体法用于分析物体运动规律的宏观表现,而隔离法用于分析物体具体的运动规律。两种方法相互统一,用于解答高中物理试题中可明显提高解题效率。本文结合自身教学经验,就如何运用整体法与隔离法解答物理难题进行探讨,以供参考。
新中国成立以来,基层治理行政化的内在机制发生了深刻变化。复杂治理与简约治理在治官权运作与治民权运作两个层面上具有不同意义。治官权运作层面从简约治理转向复杂治理,以及治民权运作层面从复杂治理转向简约治理,是基层治理行政化的两个阶段。从中国基层治理演化的历史过程来看,从上简下繁直至上下同繁,基层治理模式一直保持稳定的适配状态,顺应现代国家政权建设需求的基层治理行政化在其第一阶段能够充分展现治理效能。而
当前世界形势复杂多变并且价值观显现出多元化态势,在病理学教学中渗透思政教学是新时代医学发展的要求。为了帮助医学生培养正确的人生观、世界观,提升其职业素养,社会主义核心价值观的引导显得格外重要。在课程思政背景下从建强教师队伍、把好课堂教学和优化评价机制等方面探讨在病理学教学中融入思政元素的策略,形成课程整体育人的协同效应,实现病理学课程思政改革的目的。