【摘 要】
:
随着大数据的发展,数据量不断增加,现实中对大数据的使用需求也随之变高,但大数据中存在数据无训练标签、类别未知、风格各异等情况。如何有效的利用这些无标签数据成为一个难题。域自适应方法通过一个类别空间相同且有标签的源域训练模型,将模型迁移到目标域上使用,通过对源域与目标域的数据分布对齐,使在源域训练的模型能在目标域上具有较好的效果,有效的解决大数据无标签的问题。虽然域自适应较好的解决了大数据无标签的问
论文部分内容阅读
随着大数据的发展,数据量不断增加,现实中对大数据的使用需求也随之变高,但大数据中存在数据无训练标签、类别未知、风格各异等情况。如何有效的利用这些无标签数据成为一个难题。域自适应方法通过一个类别空间相同且有标签的源域训练模型,将模型迁移到目标域上使用,通过对源域与目标域的数据分布对齐,使在源域训练的模型能在目标域上具有较好的效果,有效的解决大数据无标签的问题。虽然域自适应较好的解决了大数据无标签的问题,但要求大数据的类别空间与训练集完全相同,实际情况中大数据的类别信息很难获取。与域自适应不同,通用域自适应取消了类别限制。只要存在有标签的源域训练集和无标签目标域的数据,即使对于两个域中共有类别信息完全未知,通用域自适应也能将训练集与目标域之间共有类别进行区分,并对目标域共有类别数据进行任务输出。现有的通用域自适应模型仅简单的使用权重机制对目标域共有类进行筛选并进行对抗判别训练,忽视了目标域私有类数据的重要性。为进一步提升目标域私有类与共有类的分离效果,本文提出了一种基于极值伪标签的通用域自适应训练方法。该方法通过样本级权重筛选出置信度较高目标域共有类与私有类数据,为该数据配置合适的伪标签,利用伪标签再训练模型。该方法有效提高了模型对目标域私有类数据和共有类数据的判别能力,提升了模型效果。在以上研究的基础上,本文还将协同学习与基于极值伪标签的通用域自适应训练方法相结合,提出了基于协同学习的通用域自适应模型。通过两个结构相同的模块对目标域伪标签数据进行交叉学习,进一步提升了模型的准确率。同时为充分利用对称模型结构的优势,文本使用两个模块的输出相似性对筛选伪标签训练集的样本级权重进行了优化,提高了伪标签数据集可靠性。将基于协同学习的通用域自适应模型在多个通用域自适应数据集上进行了测试,效果都优于现有的方法。
其他文献
夹芯保温复合板具有较高强度、较低导热系数等性能,可显著降低建筑热损耗,广泛应用于建筑围护结构。泡沫或加气混凝土等无机保温芯材虽具有强度高、防火阻燃等优点,但存在导热系数大、密度大等问题,通常采用增加芯材厚度提高保温隔热性能,但同时增加墙板厚度、重量及成本。与之相比,挤塑聚苯乙烯泡沫塑料(XPS)等有机芯材热阻更大、隔热效果更好,通过夹芯、多层复合等结构设计可解决强度低、耐候性差、易燃等问题,是未来
随着我国居民生活水平的不断提升,生鲜农产品的市场需求和流通模式也在不断变化,呈现高标准、高质量和高效率的趋势,生鲜水果的需求表现尤为明显。虽然我国生鲜水果种植产出以及产地规模集约化程度不断提升,但由于各地区地理环境和气候的差异,水果种植产出呈现显著的季节性和地域性特征,与市场期望的全年和跨地域供应需求之间一直存在无法避免的“时空矛盾”。此外由于生鲜水果自身的易腐易损特征,需要通过全程冷链来保证产品
装配式建筑节能环保、施工简单高效、可节约大量劳动力,是现代建筑发展的重要方向。装配式建筑中预制构件是重要组成,构件之间的连接是施工过程中的关键环节。众多连接方式中套筒灌浆连接是装配式建筑一种重要的连接形式,受到学术界和工业界的高度重视。但由于建筑业施工环境复杂,市面上灌浆材料质量良莠不齐,经常有灌浆料膨胀率、流动度不达标,导致灌浆不足、灌浆套筒中留存大量的空洞和缺陷等问题的存在,使锚固强度大幅降低
Data freshness is an indicator of the timing of a status update which is of utmost significance for many real-time applications,such as connected vehicles,autonomous vehicles,and sensor networks.The a
全球气候变化导致极端暴雨频发,城市暴雨内涝灾害不断加剧,严重威胁居民的人身和财产安全。随着城市化进程的推进,城市热岛效应加速了水循环使得降雨增加,下垫面不透水率的增加亦加大了内涝发生的可能;同时,人口和财产不断向城市集中,内涝一旦发生将造成难以估量的直接损失和间接损失。因此,构建适用于高度城市化地区的城市雨洪模型,评估高度城市化地区的内涝风险,对丰富高度城市化地区内涝评估技术、指导高度城市化地区防
相对于燃煤锅炉,燃气锅炉具有高热效率、低大气污染等优点,因此,燃气锅炉逐渐被广泛运用于生产生活中。锅炉长期在高温高压的恶劣工作环境下运行,若不能及时发现并处理运行中的故障,极易造成重大的安全事故。锅炉控制系统的特点是大滞后、非线性,存在随机干扰、参数时变等问题,控制效果不太理想。且当前燃气锅炉监控技术多为离线、参数恒定的控制方式,然而燃气锅炉热负荷是随末端需求动态变化的,因此当前的监控技术对工况的
随着我国地铁迅速发展,高峰期客流需求与线网运输能力、设施服务能力等供给不匹配,导致部分地铁线路列车爆满,车站严重拥挤。为了缓解客流拥挤,保证车站最长时间的运营安全,研究地铁网络协调控制策略。通过协调控制上游车站的上车客流,为中下游车站预留一定的列车剩余能力,缩短上游车站和中下游车站乘客候车时间的差异,保障中下游乘客上车的机会,保证地铁运营效率性和乘车公平性。论文的主要研究内容包括:(1)分析地铁客
土体是由固体颗粒、孔隙水、孔隙气组成的多相特殊材料,具有颗粒性和结构性的基本特征。不同尺度颗粒间因相互作用方式不同而形成复杂微细观结构,导致土体宏观变形和强度特征存在巨大差异,突显土体的多尺度特性。本文采用试验与理论分析相结合的方法,研究“膜模型”土体多尺度变形特性。首先根据能量划分准则将土体中的固体颗粒分为基体颗粒(膨润土颗粒)和加强颗粒(石英砂颗粒),当加强颗粒体分比(加强颗粒体积占土体总体积
本文在回顾何为孤独与荒诞的基础上,通过解读刘震云《一句顶一万句》的语言,探讨当下时代背景如何更好地了解他所展现的孤独、荒诞,以及中国传统孤独的书写与对民族未来发展的美好愿景。
目前垃圾焚烧发电法已成为国际主流垃圾处理方式,然而焚烧带来的二次污染问题依然严峻。SNCR技术广泛用于垃圾焚烧烟气脱硝处理,在实施时却面临着氮氧化物排放量高、脱硝效率低、氨逃逸量大等问题,严重威胁环境安全与人体健康,因此需要进一步研究脱硝特性并提出优化方案。同时,垃圾焚烧炉作为焚烧工艺的核心装置,由于工作环境复杂可能出现多种故障模式,影响整个系统的运行安全。针对上述问题,本文以广州市某垃圾焚烧电厂