【摘 要】
:
世界由不同的领域组成,通过某种方式收集到的数据集可以被看成是一个领域,不同方式收集到的数据集可以被看成是不同的领域,传统机器学习的目标是通过最小化训练数据的正则化经验风险,找到一个对测试数据的期望风险最小的模型,但是这类模型常常基于同分布假设,即训练数据集和测试数据集具有相似的联合概率分布,这种假设在现实生活中往往并不成立,因为不同领域的数据集常常具有不同的分布,迁移学习的目的是通过从语义相关但分
论文部分内容阅读
世界由不同的领域组成,通过某种方式收集到的数据集可以被看成是一个领域,不同方式收集到的数据集可以被看成是不同的领域,传统机器学习的目标是通过最小化训练数据的正则化经验风险,找到一个对测试数据的期望风险最小的模型,但是这类模型常常基于同分布假设,即训练数据集和测试数据集具有相似的联合概率分布,这种假设在现实生活中往往并不成立,因为不同领域的数据集常常具有不同的分布,迁移学习的目的是通过从语义相关但分布不同的源领域数据集学习知识,构建能够执行目标域任务的模型,迁移学习是一个影响力日益增加且充满活力的研究领域,本文回顾并总结了迁移学习近期的进展,并且提出了两个新的迁移学习算法:1)提出了一个健壮的迁移学习框架——迁移浅层表示,这个框架建立在一个简单的线性自编码机上,它可以很好地保持源领域和目标领域共同的属性,自编码机中的编码器可以将两个域的数据投影到一个潜层空间中,解码器附加了一个约束,即源领域数据集可以通过投影得以重构,此外,该框架还集成了最大化均值差异和流形正则化,这一操作可以进一步缩小源领域和目标领域之间的距离。在两个跨域识别数据集上的实验表明,迁移浅层表示算法比现有的非监督域自适应算法更有效、更鲁棒。2)设计了一种概率图嵌入算法,概率图嵌入算法首先推导目标领域样本属于每个类别的概率,然后通过构造类内图来学习一个源领域和目标领域公共的投影矩阵,这个投影矩阵可以将两个领域样本投影到一个公共的子空间中,在这个子空间中,领域差异会被极大地减少,在跨领域目标识别数据集上的实验表明概率图嵌入算法由于大多数经典的非监督域自适应方法。
其他文献
人力资本积累是经济发展质量的保证和反映,是事关中国可持续发展的重大经济问题。然而伴随着经济快速增长,个体间机会差异不断扩大,教育不平等、健康不平等等问题日益突出,进而弱势群体的人力资本相对匮乏。为促进公平,中国政府不断强化公共服务供给以弥补弱势群体人力资本的不足。由此公共服务供给是否改善了个体人力资本,尤其是处于劣势环境中弱势群体人力资本的形成?同时,现有的公共服务供给能否消除机会对人力资本的不利
水库是人类用来拦洪蓄水和调节径流的水利工程,不仅能降低洪灾损失,还能提供巨大的兴利效益。随着监测系统的普及和水文水资源理论方法的高速发展,可获得大量水文监测数据和模型模拟数据,本文从数据驱动角度研究水库调度中五大研究问题:水库实时调度开环控制系统的单向无反馈性、水库调度规则型式的不确定性、流域洪水空间分布不确定性对水库群调度规则的影响、大系统水库群中长期联合调度的多维多目标耗时特性和多变量洪水非一
随着5G网络通信时代的到来,信息安全成为人们关注的问题之一,因为没有信息安全,就没有国家安全。保障信息安全使用密码机制的网络协议即为密码协议,密码协议的设计与分析是信息安全中的研究重点,如果密码协议逻辑结构自身有缺陷,这就相当于在坚实的城墙中留下了一个无人看守的后门,未授权者就可以不用攻破密码就能获得信息或产生伪造或假冒。为了保证密码协议的正确性,很多研究者对协议进行了各种安全性分析和验证,其中逻
社会创业(social entrepreneurship)又称公益创业,是一种以解决社会、环境问题,满足公共需求为首要目标,兼顾社会价值与经济价值创造的新型创业活动。社会创业这一概念于上世纪90年代左右在美国兴起,随着孟加拉经济学家穆罕穆德·尤努斯创建格莱珉银行(Grammen Bank)向最贫苦的孟加拉人民提供小额贷款帮助其实现个体创业并彻底摆脱贫困的社会创业活动获得2006年诺贝尔和平奖,社会
背景和目的蛋白质翻译后修饰在许多细胞过程中起重要作用。O-GlcNAcylation修饰是重要的蛋白质翻译后修饰并且在多种细胞过程中起作用,例如m RNA转录,细胞周期调控,神经发育,应激反应和代谢稳态。O-GlcNAcylation修饰已被证明与神经退行性疾病和癌症有关。OGT是O-GlcNAcylation修饰中的O-GlcNAc转移酶。粘着斑是一种特殊的细胞粘附结构,它连接细胞外基质和细胞骨
背景与目的14-3-3蛋白自被发现以来,其越来越多的功能被逐渐报道出来。14-3-3蛋白在哺乳动物中共有7个亚型,这些亚型分别被不同的基因编码而成,并且都是以同源或异源二聚体的形式存在于细胞中。14-3-3蛋白是一类高度保守的蛋白质家族,其成员可与数百种蛋白质相互作用,在神经发育、信号转导、免疫反应、蛋白转运、细胞周期和凋亡等细胞生命活动中都发挥着非常重要的作用。14-3-3蛋白家族还参与许多神经
根据文化层次结构理论,学院治理文化是学院利益相关者在参与学院治理过程中逐步形成的有关学院治理的理念、制度和行为的总和,其核心构成可分解为三个要素:学院治理理念、学院治理制度、学院治理行为,三要素相辅相成、和谐共生。构建具有人本性、整合性、共享性、多样性、发展性、开放性的治理文化,是学院这一基层学术组织可持续发展的原生动力。学院是大学最重要的基层学术组织,学院治理是实现大学治理体系和能力现代化的关键
陆面与上覆大气是一个紧密联系的系统,二者之间在进行水分与能量交换的同时,影响着大气状态和陆面水文过程。开展陆-气反馈研究,对提高大气和水文模拟能力具有重要意义。传统水文模拟方法将陆面水文系统视作独立、开放性系统,侧重于描述水文系统对外界干扰的被动响应,忽视了陆-气反馈作用对陆面水文过程的进一步影响。基于物理过程的气候模式能够实现复杂陆-气反馈作用的模拟,但存在工作量庞大、模拟结果具有不确定性等难题
黑色素(melanin)是一类普遍存在于自然界的天然色素,它由酚类或吲哚类物质聚合而成。尽管黑色素不是生物体所必需,但其具有光吸收、防辐射、清除自由基等多种功能,能够为生物体提供生存优势。许多研究发现黑色素与阿兹海默症、白化病等疾病密切相关,因此,黑色素合成机制与生物学功能的研究一直以来备受人们关注。而过氧化氢酶(catalase,CAT)作为重要的抗氧化酶,普遍存在于需氧生物中,它能高效清除一类