异构域适应算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:flywate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会不断发展,人工智能的应用场景和遇到的现实问题越来越复杂,获取具有充分标注的数据集的代价越来越昂贵,这使得传统有监督机器学习算法的应用难度不断提高。域适应作为迁移学习的重要分支,是近年来广受关注的一种机器学习方法,当目标域数据集标签不足时,可以借助相似但不同的有标签源域数据训练分类器,并对目标域分类。此外,在实际生活中,还存在另一种更常见且更具挑战性的情况,即源域和目标域特征空间不一致造成的异构域适应问题。针对上文提到的异构域适应问题,本文主要进行以下方面的研究:(1)对于异构域适应分类问题,我们考虑在两域联合训练的基础上,进一步扩大类间差异,提出基于领域不变性和类别差异性的异构域适应算法。首先,针对源域和目标域分别学习映射矩阵,将两域数据映射至共享子空间,并对映射矩阵进行联合优化;其次,利用最大均值差异距离对两域数据进行分布适配;之后,引入斥力项进一步扩大类间差异,方便后续映射矩阵和分类器的训练;最后,进行结构一致性约束和特征选择,完成整体优化目标的构建,并对目标域样本进行标签预测。(2)经分析发现,已有算法大多忽略了目标域标记数据的应用。因此我们将研究重点转向目标域数据的少量标签,并提出了基于目标数据分布的异构域适应算法。首先,利用最大均值差异距离对源域和目标域进行分布适配,并学习映射矩阵;之后,进一步借助最大均值差异距离,对源域及目标域内有标签部分,和目标域中无标签部分进行分布适配,利用目标域自身特征优化映射矩阵,并拉近两域的差异;最后,控制映射矩阵参数复杂度,构建整体优化目标,进行目标域分类预测。本文分别在Office-31视觉迁移数据集、Caltech-256对象识别数据集和多语言路透社收集数据集上进行多组对比实验,分析所提算法性能,并与现有优质算法进行比较,验证了算法的有效性。
其他文献
近年来,基于深度学习的目标检测算法快速发展,诞生了许多优秀的目标检测模型,这些模型可以被分为两大类,一类是一阶段目标检测模型,另一类是二阶段目标检测模型。这两类模型都有一个相同的特点,就是利用水平候选区域来对输入图像中的目标对象进行检测,但这个特点对于充满了密集排列、体积小且朝向任意的目标对象的应用领域不太友好,尤其是产品缺陷检测领域,水平边界框不仅不能准确地表示目标对象的位置,且会使得目标检测模
随着现代社会的不断发展,飞机已经成为越来越多人的出行选择。面对持续增长的民航旅客运输量,航空公司需要增设更多的航班线路来满足民众的需求。由于我国目前的飞行人员较为紧缺,如何能够充分发挥机组成员的最大效益成为解决关键。不合理的排班计划可能会导致飞行人员疲劳驾驶,不仅影响成员的工作状态,而且还会降低飞行质量,为民众出行埋下安全隐患。因此,优化航班与机组成员之间的资源分配对于民航业的高质量发展具有重要意
裂褶多糖是一种中性β葡聚糖,具有抗肿瘤、免疫调节、抗炎及保湿等多种生物活性。然而,分子量大、粘度高、干燥后复溶性差的特性限制了裂褶多糖在工业上的大规模应用。本研究对裂褶多糖进行硫酸酯化改性,通过红外、紫外、核磁(Nuclear magnetic resonance,NMR)等表征其结构,并进一步评价其α-葡萄糖苷酶抑制活性、抗凝血活性、保湿活性,为硫酸酯化裂褶多糖(sulfated schizop
弧菌病是虾养殖过程中面临的主要威胁。目前,还不清楚弧菌是如何穿透富含几丁质的虾壳和胃肠道,进而侵入虾宿主的过程。几丁质酶是一类能水解几丁质β-1,4糖苷键的糖苷水解酶,长期被认为是弧菌的重要毒力因子,但缺少直接的证据。本课题从虾生活环境出发,筛选获得一批具有降解几丁质能力的微生物,其中包括弧菌属细菌,实验评估了几丁质降解菌的降解能力。课题针对得到的虾类主要病原细菌(三株不同种的弧菌):溶藻弧菌、哈
多目标旅行商问题是典型的组合多目标优化问题,现实生活中物流配送等问题都可以转化为多目标旅行商问题求解。相比于经典旅行商问题以距离为单一目标,多目标旅行商问题还加入了时间、风险等其他目标。目前,一种常用的方法是基于种群的多目标进化算法。但是,多目标进化算法的个体针对具体问题编码。当问题的城市数量或城市坐标发生任何变化时,都需重新运行算法求解,从而消耗大量的迭代时间。另一种常用的方法是深度强化学习算法
作为第三代混凝土减水剂,聚羧酸减水剂具有减水率高、保坍性好和结构可设计性强等优点,近年来国内的年产量高达千万吨,但低水平同质化竞争日趋激烈。目前生产的聚羧酸大多都是梳形结构,有着分散性好、保坍性强等优势,但存在被跨国企业的发明专利“卡脖子”和分散性能难以进一步提升等问题。本文设计并合成了羧基封端型聚氧乙烯醚大单体,深入探究其合成工艺及优化参数,并研究了基于羧基封端大单体的传统梳形聚羧酸合成工艺、结
红曲色素是一种天然、绿色的可食用色素,也是目前唯一一种利用微生物发酵制备的天然色素,具有抗氧化、抗肿瘤、抗菌、抗炎和降血糖等特性,应用前景广阔。红色素是其中应用最广泛的一种。随着红曲红色素研究的深入,如何提高红曲霉液态发酵产胞外水溶性红色素的产量及应用质量是目前研究的难题。稀土元素作为诱导剂,在提高植物和微生物次级代谢产物的产量方面得到了广泛的应用,但是很少有关于稀土元素对红曲霉次级代谢产物影响的
文本分类任务从离散文本数据提取出的文本特征会因领域和背景不同而存在巨大差异,因此文本分类网络模型更复杂。复杂的结构给人工挑选最优的文本分类网络模型增加了难度和成本。神经结构搜索(Neural Architecture Search,NAS)将网络模型设计过程自动化,能降低文本分类模型设计的人力成本。目前用于文本分类任务的NAS算法存在两个问题:一、建模为马尔科夫决策过程(Markov Decisi
电站燃气轮机作为调峰机组在电网负荷调控中扮演着不可或缺的重要角色。面向可再生能源消纳背景下电网深度调峰需求,采用先进的调峰方式平衡机组发电峰谷差,提高机组调峰灵活性和调峰经济性成为燃气轮机电站系统发展必不可少的一个环节。然而受外界负荷波动的影响,电站燃气轮机往往处于变工况运行状态,导致机组运行效率不高,且调峰能力受限于机组设计参数、负荷控制策略及设备寿命等约束,难以宽范围地实时灵活匹配需求侧负荷。
临床常用的承重骨替换修复体钛是一种生物惰性材料,需改性赋予其生物活性。植入体内后,钛的生物性能已固定,其与宿主的相互作用无法根据体内微环境的动态变化主动调整。因此,通过体外刺激调控钛的生物活性以适配修复过程具有重要的实际意义。研究表明,材料表面特性,如形貌和电势等,是影响细胞行为的重要因素之一。然而,表面形貌和动态电势结合对细胞行为的影响尚不清楚,因此,本文对此问题进行了研究,具体内容如下:(1)