基于激励的数据标记技术研究及应用

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户：alwbgs

【摘要】

：

近几年,人工智能的进一步发展使得机器学习,特别是基于监督的机器学习无论在学术界还是在工业界都得到了广泛应用。然而,在来自移动互联网和物联网等海量数据涌现的大背景下,

【作者】

：

孙家军

【出处】

：

南京航空航天大学

【发表日期】

：

2018年01期

【关键词】

：

机器学习主动学习用户激励多标签标记深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年,人工智能的进一步发展使得机器学习,特别是基于监督的机器学习无论在学术界还是在工业界都得到了广泛应用。然而,在来自移动互联网和物联网等海量数据涌现的大背景下,使得提供给传统主动学习算法的数据呈现范围更广、数量更大、类型更多和异构性等新特点,由此使得正确标记这些数据所需的知识将远超过专家拥有的广度和复杂度。如果仍利用主动学习算法中的雇佣专家来进行标记,那么机器学习系统得到的也将是可能含有大量噪音标记的数据。因此与传统的主动学习算法所要求专家进行无噪音标记也不再一致。而且通过雇佣专家来进行标记,无论从花费成本还是从可操作性层面看,也不再可行。近期,随着智能手机等移动设备使用的普及,使得利用群智理论来进行上面的海量样本数据标记成为可能。然而,完成这个任务面临消耗用户移动设备的大量资源(如通信和计算能力、能量等)、泄露个人隐私、支付的安全性和可信性等问题,由此导致用户参与意愿低下。因此,迫切需要设计一种机制来消除用户隐私顾虑等自私行为以期激励他们广泛参与进行高质量数据标记,从而尽可能地将人类经验、知识和智力真实地迁移到机器学习系统中。尽管现在已有部分基于激励的数据标记技术被提出,但是这些技术仍然还处于初步发展阶段。鉴于这些初步发展和人工智能应用发展的需要,本文以群智的激励机制为研究基础,结合统计学理论,在监督学习情况下,考虑样本数据具有噪声、冗余性、异构性和隐私性等特点,设计了一系列有效的基于激励机制的数据标记技术并应用到增强现实领域的视觉对象分类任务中。本文的主要的研究工作和贡献如下:(1)考虑到用户在进行数据标记提交时可能会有泄漏个人隐私的风险和发布标记任务平台的支付可信问题,本文首先针对同构和异构任务工作模型场景,设计了基于隐私保护激励的可验证的同构和异构概化的数据标记技术。然后对更复杂的子模任务工作模型场景,本文也设计了基于隐私保护激励的可验证的子模的数据标记技术。(2)为了激励用户广泛参与,考虑到用户的异构性,不同的偏好和自私性等,基于垄断融合的理论推导了边际质量的闭环表达式,并在平均冗余条件下设计了基于边际质量激励的长期数据标记技术来保证用户的高质量进行数据标记。(3)研究周期性规定标记任务约束下的数据标记问题,在具体样本冗余约束条件下,从完成指定标记任务的支付最小化角度,分别设计了基于节俭激励的半在线和在线周期性数据标记技术。(4)研究在标记花费预算约束下多标记问题,考虑到进行多个标记的内在不确定性和多样性,在无冗余约束条件下,我们分别设计了基于标价模型和贴价模型激励的在线多标记数据标记技术,并应用激励和深度学习的整合框架到增强现实领域的视觉对象分类任务中。综上,本文在群智激励研究的基础上,提出了一系列基于激励的数据标记技术,理论分析和大量实验验证了这些技术的有效性,为人工智能领域的分类和识别应用提供了理论和技术支撑。

其他文献

自动化技术在机械设计制造中的应用

伴随着我国科技技术的日新月异,特别是自动化技术的快速发展,自动化技术在各行各业开始展露头角,并且取得了不错的成绩。其中自动化技术的应用,提升了产品品质,降低了劳动人

期刊

机械设计制造自动化技术应用分析

高校知识产权信托法律制度研究

高校知识产权信托的定义为,高校作为信托法律关系的委托人,将其所有的知识产权作为信托财产,委托特定的信托机构作为受托人,进行对知识产权的管理与处分,以维护知识产权,并将

学位

中国高校知识产权信托法律制度信托法

A寿险公司完善内部控制体系的研究

保险业的快速发展,对保险行业内部的深层次的结构问题带来了挑战。在这种情况下,寿险公司在自身的经营管理中就要面临着高风险性、社会性、长期性的问题,这些问题的解决与寿

学位

内部控制岗位责任制管理制度

乙酰胆碱对大鼠成年神经发生和学习与记忆的作用及其机制研究

海马被认为是参与学习和记忆的重要脑区。齿状回是海马的一个亚区,位于齿状回的颗粒细胞发出树突到分子层,接受来自基底前脑的前穿通纤维通路(medial perforantpathway,MPP)

学位

成年神经发生乙酰胆碱长时程增强颗粒细胞齿状回海马大鼠

科技金融与区域经济发展的耦合关系研究

随着我国市场经济改革的不断深入,科技金融呈现快速发展势头。科技金融将当今时代最活跃的两个生产力要素——科技与金融有机融合起来,并越来越深入地影响着我国区域经济的发

会议

科技金融区域经济发展耦合协调度灰色关联分析空间计量模型

浅谈我国计算机辅助审计的应用现状及发展趋势

从过去的普通账目基础审计模式,到后来以风险为导向的审计模式,再到如今信息环境下的计算机审计模式,计算机的发展促使审计无论是在审计质量还是效率上有了质的飞越。文章在

期刊

计算机辅助审计审计软件审计信息化

关联理论视角下中国-东盟博览会外宣材料中的隐喻翻译研究

自从亚里士多德以来,隐喻研究一直受到学者们的青睐。隐喻研究经历了修辞学、语义学、语用学和认知科学的研究阶段,在本文中,隐喻仍然作为传统的修辞学的研究范畴。在翻译领域,隐喻翻译的研究逐渐受到研究者的重视。本论文从关联理论的视角对中国-东盟博览会外宣材料中的隐喻翻译进行研究,目的是为外宣材料中的隐喻翻译研究的发展提供一些启示。作为交际理论的关联理论所关注的核心问题是语言交际与认知。关联理论的核心概念关

学位

隐喻翻译中国-东盟博览会外宣材料关联理论

基于SFA方法我国财险公司的效率研究

效率问题是经济研究的核心问题之一。随着财产保险市场进一步的对外开放，我国财产保险业所面临的竞争压力也越来越大。如何加强自身的竞争实力，提高经营效率成为财产保险公司在

学位

财产保险效率技术效率配置效率随机前沿分析

猪脂肪间充质干细胞的分离培养及体外诱导分化研究

在动物体内,脂肪组织不仅是重要的能量贮存库和赋形组织,还是保持内环境稳定及具有分泌激素和细胞因子的重要部位。脂肪细胞增殖与分化失常是导致肥胖及Ⅱ型糖尿病的重要因素

学位

猪脂肪间充质干细胞分离培养体外分化

基质硬度通过MRTF-A调控骨肉瘤细胞的上皮间质转化及其机制的研究

目的:1.制作不同硬度的生物相容性丙烯酰胺水凝胶及测试其力学性能;2.探明MRTF-A在不同硬度梯度条件下对骨肉瘤MG63细胞的上皮间质转化现象的影响;3.验证基质硬度通过MRTF-A

学位

基质硬度上皮间质转化细胞骨架MRTF-A骨肉瘤

基于激励的数据标记技术研究及应用

与本文相关的学术论文