【摘 要】
:
为了解决主成分分析(PCA)算法无法处理高维数据降维后再聚类精确度下降的问题,提出了一种新的属性空间概念,通过属性空间与信息熵的结合构建了基于特征相似度的降维标准,提出
【机 构】
:
哈尔滨理工大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金No.61872105;黑龙江省自然科学基金No.F201302;黑龙江省教育厅科学技术研究项目No.12531z004~~
论文部分内容阅读
为了解决主成分分析(PCA)算法无法处理高维数据降维后再聚类精确度下降的问题,提出了一种新的属性空间概念,通过属性空间与信息熵的结合构建了基于特征相似度的降维标准,提出了新的降维算法ENPCA。针对降维后特征是原特征的线性组合而导致可解释性变差以及输入不够灵活的问题,提出了基于岭回归的稀疏主成分算法(ESPCA)。ESPCA算法的输入为主成分降维结果,不需要迭代获得稀疏结果,增加了灵活性和求解速度。最后在降维数据的基础上,针对遗传算法聚类收敛速度慢等问题,对遗传算法的初始化、选择、交叉、变异等操作进行改进
其他文献
用气相色谱法对米糠超临界流体萃取物中植物甾醇组成及其含量进行分析。结果表明:米糠超临界流体萃取物中含有3种植物甾醇,即菜油甾醇、豆甾醇和β-谷甾醇,其中β-谷甾醇含量
伴随着农业经济的全面进步和发展,环境管理和农业协同管理受到了广泛关注.农田重金属污染直接影响人民群众的切身利益,因此构建系统化监测工序和流程非常关键.该文简要分析了
文化产业具有低投入、低能耗、高效益等众多优点,对持续拉动经济增长起到重要作用,如今在国内外都引起了足够的重视。新疆作为丝绸之路经济带上的文化中心,具有巨大的文化资
冷诱导RNA结合蛋白(cold—inducible RNA—binding protein,CIRP)是目前哺乳动物中被广泛研究的冷应激蛋白之一。CIRP在脊椎动物间高度保守,在多种类型的细胞中均有表达,参与体内
在新媒体时代,提高新闻报道的深度有更重要的意义,然而新媒体时代下新闻报道受到了一定冲击,存在报道同质化、碎片化的浅阅读盛行、人才流失严重和制作仓促等问题,需要通过组
这是一个桌游的年代,大街小巷越来越多的“桌游吧”大有与网吧抢夺阵地的架势。以“三国杀”为代表的各种桌游正悄然改变着国人、尤其是年轻一代的休闲娱乐方式。在青年人聚
《义务教育语文课程标准(2011年版)》指出,口语交际能力是现代公民的必备能力,并明确了语文课程应该培养学生倾听、表达和应对能力的学习目标。以情境互动为切入点,以应对能
无刷双馈电机定子绕组电流能产生两组不同极对数的磁场,转子侧没有电刷和滑环,可调制这两个磁场,实现两定子磁场之间的能量转换,是一种近些年来逐步发展起来的新型感应电机,
介绍热电站的6000kW抽凝式汽轮机改为背压式机的过程,以及改造后运行中出现一些问题的解决措施,改造获得了良好的经济效益和社会效益。
本文试对讨论较多的“V起来”句给出自己的认识,只从句尾成分来谈。“起来”被我们看为表认知义的补语标记,引出补语论元AP,因而从认知的角度来说就必然涉及认知的主观性等级