基于降维技术的高维数据可视化研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:uk1030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据是人类记录信息的重要形式,而可视化是一种以图形符号等更加直观形象的方式来传达信息的技术。可视化使人类获取知识变得更加高效,它是人类获取信息的重要渠道。随着信息时代的到来,数据爆炸式增长,数据变得越来越复杂,数据维度较高。如何将高维数据可视化并反映数据特征和规律是当今可视化领域的难点和热点问题。本文着眼于利用可视化技术将高维数据可视化,帮助用户发现数据之间的关系,数据与维度之间的关系。本文的主要研究工作如下:(1)提出了一种高维数据可视化方法。由于维度爆炸及可视空间有限,用户很难可视化并探索、分析高维数据。早期的一些工作通过传统的降维方法产生隐式维度,不但损失了一部分信息,更重要的是这些隐式维度很难为用户所理解。因此,本文提出一种高维数据可视化方法,该方法结合用户有限的知识导出符合用户知识的维度,并重新组织数据。然后,利用本文基于散点图矩阵扩展的可视化呈现方法散点饼图矩阵来可视并探索重新组织后的数据。该方法可使用户发现已知数据与未知数据的关系,未知数据与导出维度的关系。实验验证了该方法的有效性。(2)设计并实现了一个高维数据可视化工具。本文通过对现有的可视化工具调研分析发现,目前存在较少的高维数据可视化工具,而且现有的高维数据可视化工具用户探索流程不够完善,不易扩展新的高维数据可视化方法。因此,亟需一个实用的高维数据可视化工具,帮助用户更好地探索、分析高维数据。本文设计并实现了一个高维数据可视化工具,该工具提供一个完整的用户可视探索数据的流程,用户可结合交互,完成对数据的探索,并可保存数据探索结果,供用户分享、查阅。而且,用户可以基于该工具,针对特定的应用扩展新的高维数据可视化方法。
其他文献
关系抽取的目标是从非结构化文本中自动获取实体和实体之间的关系,是信息抽取的重要子任务。谓词型开放关系是指基于谓词进行关联的实体间关系,这类关系在句法上依靠谓词进行
现阶段,大多数Web服务组合算法侧重于寻找一个服务质量(Quality of Service,QoS)最优的服务组合方案,但是单一的服务组合方案不能很好的满足用户的偏好需求,并且单一的选择容
阅读是语言输入的重要形式之一;也是习得语言知识和获取有用信息的重要手段。因此,阅读教学是高中英语教学的核心。然而,阅读的教学成绩并不令人满意。这引起了我国英语教育工作者们的关注,他们不断努力的开展相关的研究来寻求到有效的阅读教学方法。根据“输入假说”和“输出假说”,本研究探讨了“读写结合”对高中生英语阅读的影响。本研究讨论了三个问题:(1)“读写结合”是否对高中生英语阅读成绩产生影响吗?(2)“读
学位
在许多工程实际应用中,由于观测对象的复杂性与不确定性使得描述对象的属性值往往具有模糊性,因此常采用模糊数或区间数来刻画属性的不确定性。本文主要针对区间值数据建模,
随着时代的发展,中国英文学习者的数量在急剧上升。有限的教师资源和巨大的学习需求使得智能自动辅助教学备受关注。英文文章智能评改系统是一款为中国英文学习者写的英文文
随着信息技术的飞速发展,越来越多的数字资源通过互联网进行传播。其中数字图书馆是一种通过信息技术来存储和传播文化类数字资源的应用系统,它在互联网上担任着越来越重要的
软件调试过程中如何高效、精确地定位程序中的错误代码是软件开发人员普遍关注的一个问题。基于变异分析的错误定位(Mutation-Based Fault Localization,MBFL)应运而生,它利
随着社会信息化程度的不断提高,网络流量从2000年以来一直保持了 10年增长100倍的发展趋势,近年来,光纤通信领域迅猛发展,国内外的科研机构在基于数字信号处理(DSP)的相干光
语文课程小学生学习阶段重要的学习科目之一,对学生各方面的影响都很大。随着国家对教育的重视程度的提高,小学语文课程的教学也逐渐引起了教育领域的重视,而情感教育作为小
近年来,移动数据业务和智能设备数量快速增长,移动设备的数据流量不断增加,这对数据传输速度和稳定性提出了更高的要求。LTE网络为用户提供了更高的数据传输能力,因此,LTE网