【摘 要】
:
最小最大模块化支持向量机(M3-SVM)是一种可以有效处理大规模数据分类问题的有监督集成学习算法。然而,对大规模数据进行标注是“昂贵的”,甚至是不可行的。为了将最小最大模
论文部分内容阅读
最小最大模块化支持向量机(M3-SVM)是一种可以有效处理大规模数据分类问题的有监督集成学习算法。然而,对大规模数据进行标注是“昂贵的”,甚至是不可行的。为了将最小最大模块化支持向量机拓展以处理那些未标记数据,本文将最小最大模块化支持向量机和半监督学习相结合进行研究。本文研究的内容主要包含以下两个部分,一方面是提出一种半监督最小最大模块化支持向量机(SS-M3-SVM)算法。在SS-M3-SVM算法中,首先对有标记数据集和未标记数据集进行任务划分,然后将有标记样本子集和未标记样本子集两两结合,形成多个新的训练子集,并在这些训练子集中探索其中包含的隐藏变量。在求取了隐藏变量之后,将隐藏变量对有标记样本的后验概率作为有标记样本的新特征,这样新特征中包含了未标记样本的一些判别信息。最后在包含了新特征的有标记样本子集上分别训练支持向量机(SVM)分类器,并按照最小最大规则集成实现半监督最小最大模块化支持向量机。另一方面,在半监督最小最大模块化支持向量机算法的基础上,从未标记数据抽取以及未标记样本和有标记样本关联矩阵的角度,提出了基于抽取策略的半监督最小最大模块化支持向量机(Boost-M3-SVM)算法。与半监督最小最大模块化支持向量机不同的是,其训练子集中的未标记数据是通过抽取而不是任务划分获得的并且其有标记样本和未标记样本的关联矩阵采用相似性度量而不是距离度量。实验证明半监督策略能够有效提升传统最小最大模块化支持向量机的学习能力。
其他文献
近年来,研究者越来越重视通过应用数据挖掘技术在海量数据中发现知识和规则。在数据挖掘过程中,数据可视化技术是保证挖掘结果便于用户理解数据和进行交互的重要途经,因此数
基于Web的信息系统通过Internet来为用户或其它系统提供信息服务,随着Web技术的不断发展,这类系统越来越普遍。学习和研究Web信息系统的开发方法,在当前具有重要的现实意义,
在信息技术领域,云计算作为目前最热门的话题之一为现代高速计算提供了新思路,即采用了一种新型的基于因特网的计算模型实现了高速计算。但目前云计算中的安全问题日益突出,
社会容迟网是具有一定社会关系的人所形成的具有社会性的容迟网络,所以研究社会容迟网的路由方法需要充分考虑到网络中节点的社会性和容迟网络的特性。节点的社会性主要体现
近年来,由于访问控制系统的发展和应用环境要求的提高,现有的访问控制模型已经不能满足访问控制的需要,特别是对于有动态应用要求的系统,传统的访问控制模型实现起来比较复杂
随着多媒体技术和计算机网络技术的发展,人们接触到的视频数据以前所未有的速度增长。然而,现有的视频信息处理技术大多数是非智能的操作,远远不能满足海量且内容丰富的视频信息
随着复杂网络的小世界效应及无标度性的发现,复杂网络的容错抗毁性研究成为热点。相关研究表明,复杂网络对随机攻击具有很强的鲁棒性,而对有目的攻击却极其脆弱。对网络中的节点
多值逻辑是一种逻辑取值数大于2的非经典逻辑系统。其研究内容主要包括多值逻辑理论、电路与系统和应用等三个方面。多值逻辑函数结构理论是多值逻辑理论的研究内容之一,它主
随着社会对电力需求的日益增加,供电企业越来越需要能够对用户电表进行有效监测和控制的方法。目前的自动抄表技术主要分为有线和无线两大类,由于有线自动抄表技术安装复杂,维护费用较高,覆盖范围小,因此,无线自动抄表技术越来越受到关注。本文研究基于无线传感器网络的电表监控技术。为充分利用现有电表实现无线监控,本文首先设计一种基于无线传感器网络的电表无线监控接口装置,该装置主要由微控制器、无线收发器、红外传感
农作物是人类生产和生活所必需的资源,农作物的产量和质量直接影响到人类的生活,而病虫害是农作物生产过程中的重要制约因素。由于受全球气候变暖、生态环境恶化等因素影响,农作