基于相似度的两视角多示例学习算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:yuanli1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多示例学习中,训练集由一组包所构成,每个包含有若干个示例。只有包的分类标签已知,而包内示例的分类标签未知。例如,在图像分类中,一幅图像可以切割成不同的区域,一个图像看作一个多示例包,一个区域可以看作一个示例。如果一个包被标记为正包,则它含有至少一个正示例。如果被标记为负,则所有示例为负。多示例学习在图像分类、文本分类等问题中有着重要的应用。另外,图像、文本等数据可以通过不同的角度来进行描述。对这些不同角度数据的学习,被称为多视角学习。为了进一步提高图像分类和文本分类的精度,本文把多视角学习应用到多示例学习中,提出了基于相似度的两视角多示例学习算法。本文主要的研究工作包括:(1)提出一种基于相似度的两视角多示例学习方法(Similarity-based Two-view Multi-Instance Learning,STMIL)。首先,由于正包内的示例标签未知,我们提出了相似模型和相似度计算公式。使用k-means聚类算法对包进行重构,在重构包的基础上,计算每一个示例相对于正类和负类的相似度。其次,我们把图像和文本等数据通过两个视角来进行表述,把两个视角的数据融合到相似度模型中,设计了基于相似度的两视角多示例学习支持向量机算法。最后,通过启发式迭代框架,更新示例相对于正类和负类的相似度,直到算法收敛。(2)为验证基于相似度的两视角多示例学习方法的可行性,我们将该方法与现有的多示例学习方法(GMI-SVM、mi-SVM、DD-SVM、Well SVM和PSVM-2V)进行对比实验。在实验过程中,首先分别使用三种聚类方法(k-means、EM聚类和DBSCAN)和两种图像分割方法(Grab Cut和MILCut)对图像数据和文本数据进行预处理,然后与上述五种多示例学习方法进行比较。实验结果证明,我们的方法具有更高的分类精度。另外,我们还在输入数据中添加不同比例的噪声,以测试不同多示例学习方法的抗噪声性能。实验结果证明,与现有的多示例学习方法相比,我们的方法具有更好的鲁棒性。
其他文献
随着工业自动化和智能技术的发展,传统的物流系统难以满足日益增长的生产速度和消费需求,因此传统产业链面临着越来越严峻的挑战,迫切需要进行升级改造。AGV是一种集传感器检
随着国民经济的快速发展,各行各业对电能质量的要求越来越高,在我国电力负荷结构日趋复杂的情况下,如何保证供给用户侧优质电能且有效治理非线性与冲击性负荷引入的污染具有重要的现实意义。本文以含储能装置的统一电能质量调节器(Unified Power Quality Conditioner,UPQC)为研究对象,针对其在不同工况间的无缝切换技术展开研究。首先,针对传统控制策略中UPQC串联补偿器利用率低的
面对极具危害的森林火灾,现有的基于可见光和热红外的火灾预警系统对温度比较敏感,当有烟火产生就会立即报警。但是森林场景比较复杂,仅仅根据热红外原理检测火灾很有可能造
高聚物粘结炸药(Polymer bonded explosive,PBX)是一种性能优良的钝感耐热炸药,在武器领域已经得到了广泛的应用。PBX炸药在制备、运输、存储的过程中,会产生裂纹、孔洞等损
多目标跟踪技术是计算机视觉任务中重要的子课题,在智慧安防,自动驾驶,自动导航,导弹制导,群体分析等方面有着重要的意义。长期以来很多工作都在致力于提高多目标跟踪的精度,
基于计算机视觉的身份自动识别是目前一个热门的研究方向,其主要应用于公共空间的监控系统中,对公共安全起到非常重要的作用。计算机视觉通过使用每个人所独有的生物特征来区
青川天然岩沥青与基质沥青相容性好,少有离析发生,可以显著提高沥青软化点,改善沥青的高温抗车辙性能,且具有施工工艺简便等优点,已被广泛地应用于道路建设中,但对于岩沥青改性沥青混合料及岩沥青与SBS复合改性沥青混合料结构性能的研究开展较少。本文通过室内试验和结构复合试件加速加载试验,结合理论分析对岩沥青改性沥青和岩沥青与SBS复合改性沥青及其沥青混合料的性能进行了研究。通过“湿法”工艺分别配制青川岩沥
糖尿病动脉硬化是多种心脑血管疾病——冠心病、脑卒中以及周围血管疾病的共同病理基础。血管外膜成纤维细胞(adventitial fibroblasts,AFs)是血管外膜最丰富的细胞类型,糖尿病状态下,其发生表型改变和增殖、迁移能力增强,胶原分泌增加,是导致动脉硬化主要病理机制之一。AGEs是蛋白质、脂蛋白或者核酸等大分子在非酶催化、自发的与葡萄糖或其他还原性单糖反应所形成的稳定的共价生成产物,是糖
MicroRNAs(miRNAs)是一种长度约为22 nt的小的非编码RNAs,可与靶mRNAs 3’端非翻译区结合,甚至与其编码序列及启动子结合,抑制mRNA翻译和/或引起mRNAs降解。MiRNAs具有影响多
自2004年国务院提出要进行京津冀地区规划编制以来,关于京津冀区域如何合作发展的争论异常激烈。最明显的一种倾向是盲目看重政府行政力量,似乎一旦规划出台号令一下,区域内
会议