【摘 要】
:
在大数据背景下,缺少数据依然是一个普遍而严重的问题。由于事务具有多样性在有限的集合里无法全面覆盖,或者相关情景在现实生活中极少出现,都会导致样本数据的缺少。针对该问题的解决思路有很多,本文的主要解决思路是对缺少的数据进行过采样处理,通过丰富样例解决问题。本文所针对的任务是基于传感器数据的人体活动识别任务,提出了在该领域中由于数据缺少导致的两个问题,并针对问题提出了解决方法。第一个问题是同域数据不平
论文部分内容阅读
在大数据背景下,缺少数据依然是一个普遍而严重的问题。由于事务具有多样性在有限的集合里无法全面覆盖,或者相关情景在现实生活中极少出现,都会导致样本数据的缺少。针对该问题的解决思路有很多,本文的主要解决思路是对缺少的数据进行过采样处理,通过丰富样例解决问题。本文所针对的任务是基于传感器数据的人体活动识别任务,提出了在该领域中由于数据缺少导致的两个问题,并针对问题提出了解决方法。第一个问题是同域数据不平衡问题,针对训练集合中存在活动类别数据量不平衡的问题;第二个问题是迁移学习中的域适应问题,并且是针对活动识别领域中在人与人之间进行迁移的问题,问题中存在目标域带标签数据极少量的问题。在第一部分中,本文在3个公开数据集进行实验。首先根究问题描述和对混淆矩阵的分析,发现当分类器在不平衡数据中进行训练,模型在测试中对于少数类别的数据很大可能会存在分类错误的现象。本文针对该问题提出的解决办法是利用对抗生成网络对少数类别数据进行过采样处理。而后对传感器数据分析注意到传感器数据具有时间窗口的特点。根据数据特点提出了BAGAN-SSIM模型作为少量数据的生成模型。在第二部分中,本文针对迁移学习中的域适应问题。阐述了在活动识别领域人与人之间进行迁移学习的必要性,并针对该问题提出了对抗迁移网络模型。在数据分析过程中发现,原域、目标域数据分类的易混淆类别的特征分布会非常相似。根据这一点,提出了拉开类间距的需求,通过实验对比确定了cosFace函数作为模型的损失函数。在最后部分,将对抗模型变为在线学习模型。在线情况下的模型准确率有所下降。实验表明此时模型迁移后的准确率随着输入标签的种类的减少,模型准确率保持在75%以上。
其他文献
对6根配置500MPa级不锈钢钢筋的混凝土简支梁和2根配置500MPa级普通热轧带肋钢筋的混凝土简支梁进行了两点集中加载的受弯承载力试验研究,分析了混凝土强度、纵筋配筋率等对
传送电路裹冰严重影响到电力装置的稳定运行,给社会正常运行造成干扰,而且还会带来很大的经济浪费。笔者以治理传送电路裹冰问题为目标,由具体情况着手,探讨了传送电路的裹冰
以兰州地铁2号线某车站的建设为工程背景,研究分析了装配式铺盖体系。主要包括装配式铺盖体系的构成,计算工况和载荷的选取;利用Solidworks软件对装配式铺盖体系进行三维建模
为进一步提高学生的创新创业能力和素质,以素质和能力为目标,通过项目整合、合作性教学模式改革、课程考核模式创新、现代教学资源和技术手段应用、新型教学方式的师资培养等
课题制是研究与开发活动中以课题为基本单元,以课题组为基本活动单位,以市场方式为主配置科技资源,以法律手段规范各行为主体的责权利,来进行组织管理的一项基本制度。我国科
多发性骨髓瘤(MM)来源于异常幼稚浆细胞克隆性增生,急性髓细胞白血病来源于骨髓异常粒系造血干细胞极度增殖,两种疾病同时病历鲜有出现,笔者临床中首次出现此种特殊案例,望同道医家
目的分析与探讨妊娠期糖尿病孕妇早产及足月分娩的临床特征差异与早产危险因素。方法选取该院2013年9月—2015年9月收治的240例妊娠期糖尿病孕妇,其中早产孕妇70例作为早产组
干细胞的发现,改变了以往认为成年哺乳动物中枢神经系统神经元不能再生的认识,成为神经系统疾病的一种新治疗策略而备受当前国际医学界关注。本文对干细胞的分类,干细胞移植
从心理学角度,结合压力产生的心理学原理,着重分析了大学生就业压力的来源及表现,并从认知系统、社会支持系统和免疫系统等三方面对压力的缓解提出了相应的对策。医学生的心理健