【摘 要】
:
在对高维数据进行可视分析的时候,降维算法无疑扮演着重要的角色。降维算法能够将数据投影到对于人类而言认知起来更加容易的低维空间,这将更加方便用户对数据不同类之间的区
论文部分内容阅读
在对高维数据进行可视分析的时候,降维算法无疑扮演着重要的角色。降维算法能够将数据投影到对于人类而言认知起来更加容易的低维空间,这将更加方便用户对数据不同类之间的区分度和数据的空间分布进行探索。然而,现在被广泛应用的非监督的降维算法,如PCA,它的降维目标并不是尽可能最大化类间距。而有监督的降维算法如LDA,只适用于符合高斯分布的数据,并且没有将人类的认知考虑进去。这些问题导致了这些方法在处理复杂类结构数据的时候束手无策。为了填补这方面的空白,本文提出了一种以人类视觉感知驱动的线性降维算法,该方法旨在降维过程中,最大化符合人类视觉感知的数据的类间距。最近,基于感知的类间距度量方法在模拟人类视觉感知能力上取得较大突破。我们的方法正是基于这样的基础发展而来。我们将这些方法进一步改进,融入类密度信息,并结合到模拟退火算法中,求解出近似最优解。为了验证该方法的可靠性,高效性和扩展性。我们将该算法与现在最常用的几种降维算法在93个数据集上进行数值层面的理性比较和用户打分的感性比较,并对算法性能加以分析。同时,还将该算法扩展到类分布不均匀数据和无类标签数据上。最后还和星坐标(star coordinates)系统相结合,提供一系列的交互手段,方便用户对数据进行进一步的探索。
其他文献
<正>2011年我们将迎来浙江省实施新课程以后的第三届毕业生,这也是浙江省实行思想政治学科自主命题的第三年。所以,如何有针对性地上好高三复习课,提高复习的效率和效果是高
<正>痤疮是一种发生于面颈、胸背部的毛囊、皮脂腺的慢性炎症性疾病,其特点为颜面和胸背发生针尖或米粒大小的丘疹,或见黑头、脓疱、结节甚至囊肿,青春期多发,具有—定的损容
高句丽末代王室高氏家族在唐高宗朝迁入中原定居,国王高藏担任了唐朝的工部尚书。随着唐朝跟周边民族和国家关系的发展,高藏和他的子孙先后被册封并派回旧地统辖部众,策应唐
在“一带一路”发展背景下,内地西藏高职班通过招生政策倾斜、重点教育培养、资助帮扶、提升就业创业能力等方式和策略来有效推进教育扶贫工作意义重大。内地西藏高职班在专
目的探讨羊水细胞、脐血细胞ABO血型的PCR-SSP基因定型方法的可靠性。方法采集孕妇羊水细胞和新生儿脐血细胞,ABO基因定型用PCR-SSP法,血清学定型用低离子溶液常规单克隆标准血
根据川西卧龙地区林线位置岷江冷杉(Abies faxoniana)的年轮宽度资料,分析了该地区树木年轮宽度与气候要素的关系,并重建了该地区1850年以来夏季(6-8月份)温度的变化历史。结
随着当前教改不断的深入,人们对音乐教育有了新的认识,音乐教育也越来越被重视。音乐课堂教学是中小学音乐教育活动的基本组成部分,也是对学生进行素质教育,使学生全面发展的
当今社会,现代化工业飞速发展,发展就离不开消耗,工业的发展对能源的消耗也是极大的。石油作为一种可广泛运用于各行业各方面的能源,人们对石油的开发和采取也是极大的。作为
采用挑刺方法治疗本病10例(男9例,女1例),痊愈7例,好转2例,无效1例。方法如下。先在患部寻找暗红色的“凹”,这些“凹”小似针尖,其上多有毛.压之不退色,常在最痛部位有一个
特殊的地理位置、多神教和东正教信仰的交叉融合以及几经巨大变革的动荡历史,造就了俄罗斯民族性格的双重性和悖论性。语言是民族精神外化的产物,其中隐匿着人类心智以及思维