基于K近邻的密度峰值聚类的财务大数据研究与应用

来源 :辽宁石油化工大学 | 被引量 : 0次 | 上传用户:tsmljgh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,数据分析越来越复杂、难处理、难分类,数据维度越来越大,针对密度峰值快速搜索聚类(Clustering by fast search and find of density peaks,DPC)不适应高维数据集的缺陷,提出了一种名为T-DPC的优化算法,该算法基于t-SNE降维方法入手,并且还优化了高斯核函数的计算方法,在求解密度时使用统一的度量准则。实验中选取了人工数据集和UCI标准数据集,将DPC算法在人工数据集和UCI数据集与T-DPC算法进行对比,最终实验结果表明,T-DPC算法不仅适应了高维数据集,还提高了DPC算法效率。改进的K近邻密度峰值聚类算法以密度峰值聚类算法(DPC算法)为基础,结合K近邻技术,改进了K近邻的密度峰值聚类算法。通过改善自适应的度量手段和结合K近邻的分配策略解决了原算法中的问题。解决了dc选取的主观隐患和分配方式不好的问题。当今股票市场最热门的话题是如何获得最大利益并且使得收益风险最小化。这成了许多研究者的主要研究问题。股票市场是一个体系复杂、种类偏多、结构混乱,各种因素相互制约影响。如何选择股票是当今股民们最关注的问题。为了验证改进的K近邻的密度峰值聚类算法在财务大数据中应用,实验选取了沪深A股中40家上市公司2018年第二季度的股票数据作为财务数据的研究数据,股票数据中分别选取了净利润、每股收益、净资产收益率、营业收入、每股净资产五项数据进行数据分析,这五项数据能反映该上市公司综合盈利状况,经过数据降维处理,然后通过k近邻的密度峰值聚类算法对股票进行分类,选出绩优股和绩差股。
其他文献
当前,举国上下都在谈论物联网,这让我想起了六年前为中铁直快做长期发展规划时听到的一则消息:我同铁路某中枢站每日有上万辆车厢进出,每年都会有上百辆车箱找不到下落(不知停在哪
  本文详细阐述了单教授对胆汁反流性胃炎的辨证思路,在BRG临证时,不仅要明确“邪在胆,逆在胃”有邪之不同,更要辨析“邪虽在胆,逆不在胃”及“邪不在胆,逆亦在胃”,如此方能准确
华为,总部设在中国南方的电信设备及服务供应商,如今已经成长为一个世界级选手,这家公司以其热切的渴望和进取心颠覆了整个行业,压低了由老牌跨国企业设定的产品价格。
CNNIC部署域名安全系统,并对我国域名体系IPv6进行升级改造。目前,CNNIC已完成全球19个节点建设,计划扩展至30个节点;每日DNS查询约15亿次,其中IPv6查询约占10%。
从1月份起,中国移动将在全国范围内全面开展“金牌服务,满意100”活动。引导和鼓励广大客户通过“10086999”短信平台和10086人工服务等免费途径进行垃圾信息举报。在广受关注
移动数据流量高速增长是LTE发展的基本动力 测量结果表明,当前全球移动数据流量比语音流量的增长快10倍以上。从2009年第四季度数据流量超越话音流量起,到次年6月已达话音流量