数据可视化分析平台下ResDAE-KMeans++算法的研究与实现

来源 :郑州大学 | 被引量 : 0次 | 上传用户:tanxiaoming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用数据来指导生产生活的思维古已有之。随着文明的发展,从互联网+到创新驱动,从国家战略云到智慧城市,从单一领域研究到多领域融合,无不显示着社会数字化程度逐步加深。因此,当前社会能够获得和处理的数据越来越多,要解决的问题体量也越来越大,非专业人士对数据进行高效、详细的分析逐渐变得困难。为此,深圳市大数据研究院的数据可视化分析团队设计了一款结合数据分析和可视化前沿技术的在线数据可视化分析平台,其目的在于提高数据处理效率,降低用户进行数据分析、数据可视化的门槛。该数据可视化分析平台集成了100多种数据分析和数据可视化功能。作者参与了平台的设计与实现,将一些数据分析和可视化算法集成到数据平台下并封装底层调用,使这些功能作为一种服务提供给用户。用户只需简单的操作就可以享受数据获取、清洗、分析、可视化一站式服务。在平台开发应用过程中,无监督聚类算法作为重要的机器学习算法在数据可视化分析平台中有着重要作用。然而,平台使用的传统聚类分析算法对高维数据处理存在效率低下、性能不佳的问题。因此,论文提出了一种新型的与深度学习集成的无监督聚类算法,即Res DAE-KMeans++算法。为应对高维数据维度灾难问题,该方法在结合残差单元(Residual Unit)的深度自编码器(Deep Auto Encoder,DAE)基础上,应用K-means++在低维特征空间中自主聚类。相较于传统无监督聚类算法,应用非线性的残差自编码器提取特征空间使得聚类速度显著提升的同时,准确率也得到了进一步提高。该方法在Iris、Wine、MNIST数据集上与传统无监督算法进行对比,实验结果表明,Res DAE-KMeans++算法对比传统聚类算法存在明显优势。
其他文献
对辊制粒机通过挤压制粒的方式完成制粒过程,具有成粒性好,生产效率高,设备维护便捷等优点,近年来已成为陶粒成型过程中的主要设备。但以往对制粒机的设计制造主要是基于经验,目前仍然存在成品率低、制粒辊磨损快且容易开裂、制粒过程中振动及噪声大等问题。针对以上问题有必要对影响对辊制粒机性能的关键技术问题进行探讨分析。首先,对物料辊轧过程和单孔制粒过程进行了理论分析,初步探讨了物料在制粒过程中的密度、压力等的
学位
化石燃料的污染、能源需求的增长,加上大气中二氧化碳的有害影响,正迫使全世界寻找发电和储存能源的替代方法。世界各地的科学家们都在寻求不同的方法来生产和储存能量。太阳能和风能是发电的可再生资源,但不是连续的,需要存储设备。因此,发展高能量和功率密度的电池和混合超级电容器对补充这一能量存储需求具有重要意义。其中,超级电容器因其高功率密度(>10 kw kg-1)、优异的速率能力、延长稳定的循环寿命(>1
信道编码是通信系统中至关重要的一环,可以有效的增强信号的抗干扰能力。LDPC码由于其良好的性能,被广泛应用于现代通信技术领域。本文通过对LDPC码译码过程的分析,得到影响译码成功的关键因素是变量节点置信消息的准确度,所以可以利用帧同步字和LDPC码相结合提升变量节点消息的可靠性,从而实现快速准确的译码。首先,通过对数字通信系统模型的介绍,突出了信道编码在通信系统中的重要作用。简单分析了LDPC码的
提升用户感知是无线通信网络“规建维优”的核心,网络覆盖水平与拥塞情况是影响用户感知的关键。因此,对网络覆盖的有效评估与网络业务量及利用率水平的合理预测,是无线网络优化领域长期以来的研究重点。基于测量报告(Measurement Report,MR)大数据分析的评估方式较传统路测方式更为高效准确;基于话务数据的深度学习模型较传统线性模型更为精准灵活。因此MR及话务大数据分析对LTE无线网络的规划建设
随着信息技术的快速发展,数字多媒体的分享与传输变得更加方便快捷。多媒体编辑工具的出现为人们对数字多媒体进行复制和修改等操作带来了便利,然而一些不法份子可以很容易的利用这些工具对数字多媒体进行非法的篡改和伪造,并且不会留下明显的痕迹,导致数字多媒体内容的真实性和可靠性难以辨认。半脆弱水印技术不仅可以有效的检测出篡改区域,还能够容忍一些不改变载体主要内容的常见信号处理,成为了数字多媒体内容认证的重要手
学位
学位
学位
学位