【摘 要】
:
随着科技的飞速发展,大数据和云计算的时代的到来,数据集的出现形式越来越趋于海量数据、高维数据、非线性数据,故而数据降维这个古老而又新型的数据处理方式发挥着不可替代
论文部分内容阅读
随着科技的飞速发展,大数据和云计算的时代的到来,数据集的出现形式越来越趋于海量数据、高维数据、非线性数据,故而数据降维这个古老而又新型的数据处理方式发挥着不可替代的作用。局部线性嵌入降维算法(LLE),要求数据集必须是均匀分布的,在选取每个样本的K近邻时,需要对数据集本身要有先验估计,K值的选取是人为确定,故K值的选取比较敏感,数据集中噪声点对降维效果影响较大,而且对图像数据集降维效果不稳定。本文将针对局部线性嵌入算法(LLE)的缺点和不足,深入研究基于密度的局部嵌入降维算法,提出合理的改进算法。具体研究内容如下:本文提出图像非欧距离代替传统的欧式距离度量,使得改进的LLE算法降维效果稳定,同时应用到图像处理领域取得较好的效果。结合数据集的降噪处理方式,首先利用LDA方法进行预处理;采用均分切割技术对数据集进行分块处理,避免了噪声点对降维方法的影响;针对LLE算法人为选参的方法,提出了一种基于密度的局部嵌入降维算法(DALLE),自适应的参数调节方式,根据某样本周围点的密度进行邻域选取。通过对比仿真实验结果表明,DALLE算法复杂度与原LLE算法复杂度相当,但是对噪声点不敏感,而且不需要人为选取参数值。进一步通过分析以及实验,相对于已有的降维算法,DALLE算法对非线性数据集产生了较好效果,完成了降维目标。
其他文献
目前基于IBM刀片集群的解决方案,功耗体积较大,效率较低,不适应星载以及小型化应用的发展。基于Tilera众核平台的开发周期较长,成本较高。JPEG2000标准是在原有的JPEG标准的
电子背散射衍射(EBSD)已成为扫描电子显微镜(SEM)的标准配置附件。借助EBSD技术获得的菊池花样,SEM可以进行相鉴定、晶体取向以及织构分析。现有的这些应用在技术上是成熟的,其算法主要是基于Hough变换识别EBSD花样的菊池带。由于Hough变换不能直接识别双曲线,由传统的Hough变换获得的菊池带信息是不准确的,这给EBSD花样解析未知晶体的Bravais点阵造成致命影响。为此本论文主要
马腺疫作为一种急性接触性传染病,可引起马属动物颌下淋巴结肿胀,严重时可致死,该病给世界各地养马产业造成严重的经济损失。马腺疫主要由马链球菌马亚种(Streptococcus equi
在互联网技术广泛应用于各行各业的今天,我们迎来了云计算的迅速发展。它提供了一种新型的商业计算模型和服务模式,可以将计算、存储、网络和应用等等汇集到一起,用户只要按
目的:观察枳术丸合双合汤加减治疗脾虚瘀阻型糖尿病周围神经病变的临床疗效。方法:本研究采取随机对照的研究方法,将符合诊断标准的60例DPN患者,随机分为对照组和治疗组,每组30例。在糖尿病教育、饮食指导、调控血糖、血脂、血压等基础上,对照组给予甲钴胺片口服,治疗组予以枳术丸合双合汤加减进行治疗。两组服药疗程均为8周。疗程结束后,观察治疗前后两组患者在中医证候积分、神经传导速度、Toronto评分等有
伴随着社会需求的增加以及视频处理等技术的发展,新一代视频监控系统能够实现网络高清视频的实时传输,并在现实中得到越来越广泛的应用;而目标跟踪算法作为计算机视觉领域的
Android操作系统在当今的市场上有着很高的占有率,用户对于Android手机的使用量已经越来越大。但是,Android手机上的恶意App的数量也在逐渐增加,对于使用Android设备的用户造
随着网络技术和移动客户端技术的不断完善和发展,人们每时每刻都在产生、共享和传递数据,其中很大一部分是以文本形式存在的。如何从文本数据中高效的提炼有用的信息和模式已
农村土地整治作为保障国家粮食安全和土地资源的手段,承担着“稳增长、调结构、促改革、惠民生”的根本责任。根据党的十九大报告,必须大力实施乡村振兴战略,大力推进我国农村现代化的进程。作为七大战略之一,农业农村问题已经成为农村地区面临的突出问题。作为促进我国农业和农村发展现代化的手段,农村土地整治不仅是保障乡村振兴战略成功实施的关键,同时也是扩大内需、促进经济水平增长、有效化解产能过剩从而深入推进供给侧