【摘 要】
:
分类问题作为数据挖掘的一个主要研究的领域,在实际工程中的应用越来越多。面对日益增加的分类需求,本文结合同一个数据集的多个分类需求,提出一个优化的联合分类的算法。旨
论文部分内容阅读
分类问题作为数据挖掘的一个主要研究的领域,在实际工程中的应用越来越多。面对日益增加的分类需求,本文结合同一个数据集的多个分类需求,提出一个优化的联合分类的算法。旨在保证分类性能,即算法的收敛速度足够快,与此同时提升联合分类的效果,达到提高分类效率的目的。本文提出一个名为RWDLP的半监督学习算法,可以同时解决在同一个数据集有多个不同的分类任务的问题。本文在开篇回顾了分类问题目前在国内外的研究现状,介绍了一些常见的分类算法与应用,接着从以下方面展开工作:首先,详细分析与讨论基于马尔可夫链的随机漫步(RW)的过程与应用,和标签传播算法及其改进版的动态标签传播算法(DLP)的思路和过程。通过分析这两种算法的共同点,本文提出一个结合两者特点的RWDLP算法。该算法的主体是基于马尔可夫链的随机漫步,但在漫步的过程中,结合动态标签传播算法的思想,加入了转移概率矩阵的动态更新步骤,及近相似性的思想,使分类过程更有效地利用了类标集的信息,同时也通过重启动技术保证了迭代的收敛速度。接着,本文将RWDLP算法与联合分类的场景结合起来。先构造一个包含实例和多个异构类标集的混合关系图,然后在图中进行基于马尔可夫链的随机漫步。本文提出的算法突出的优点是充分利用每个类标集内部与异构类标集间的信息进行分类,以及联合两个或多个分类任务,在保证迭代收敛速度的前提下,提高了分类的效率。最后,在实际的生物信息学的数据集中,通过与其他经典算法的对比,证明了本文提出算法的有效性。本文提出的优化的联合分类算法,通过实验证明了其有效性与实用性。随着分类应用越来越广泛,面临的问题与需求也越来越多,对算法的通用性与效率的要求也越来越高,本文提出的RWDLP算法正好满足了这些发展要求。
其他文献
作为机器学习领域的一个热门分支,深度神经网络已经在计算机视觉、智能搜索、无人驾驶、模式识别等领域取得了令人瞩目的成就,而且随着深度学习的广泛应用在未来依旧会保持着
时相和归一化植被指数(NDVI)时间序列特征在农作物分类提取方面具有重要的应用价值。以黑龙江红星农场为研究区,利用多时相环境星HJ-1A/B CCD数据及其多期平滑重构后的NDVI时
基于对冷轧退火炉张力设定值计算模型的研究与优化,运用S7-400PLC、S120变频器及PCS7软件平台,构建了退火炉张力闭环控制系统,确保了机组运行的稳定性与可靠性。通过对张力设
经济法课程教学中采用项目教学法,就是在课堂教学中将教学内容融入项目中,学生在参与项目研究的过程中学习经济法知识。学生在课堂上充分发挥主体作用,教学对学生的学习情况
水资源紧缺局面愈演愈烈,迫切需要进行水资源优化配置,以此提高水资源利用效率。基于自然元启发的优化算法越来越多的应用于求解多目标水资源优化配置问题。飞蛾火焰算法全局
HIV-1慢性感染主要破坏人体免疫系统。虽然高效抗逆转录病毒治疗能够通过抑制病毒复制在部分患者中实现免疫重建,但由于其本身局限性,很难清除体内HIV-1储藏库。近年来,一些新的
目的:自身抗体高表达为自身免疫性疾病的重要特征,其具体机理尚未揭示清楚。Whitehouse于1972年首先报道肿瘤患者体内存在抗平滑肌抗体。多年来,国内外陆续报道了肿瘤患者体内存
外资银行进入对内资银行的绩效究竟将会产生怎样的影响?本文通过实证研究的分析方法,阐述了外资银行进入新兴市场经济国家,对东道国内资银行业的绩效影响。得出长期比短期更具
从患典型"突眼病"金鱼的眼球、肝脏中,分别分离出E-01和L-01菌,经人工感染试验确认E-01菌为该病的致病菌.该菌菌体大小为(1.0~1.5)μm×(1.5~2.3)μm,革兰氏阴性,无鞭毛;触
近年来,广场舞逐渐成为了我国的一种群众喜闻乐见的文化娱乐方式。随着城市化进程的脚步加快,人民群众的生活质量不断提升,广场舞作为群众基层文化强有力的表现方式之一,受到