【摘 要】
:
随着人工智能等高新技术的发展与普及,口常生活中产生和需要利用到的多是多值多标记数据,相比于单标记学习这类传统的监督学习,多标记学习显然更能满足实际生活的需要。在多标记学习中,每个样本常常同时归属于多个类别或者是具有多个标记。研究标记之间的相关性有助于解决多标记分类问题中随着标记数量的增多而带来的标记空间的膨胀、存储要求高、时间成本高等问题,提高多标记学习算法的预测性能和效率,使其具有广泛适应性。决
论文部分内容阅读
随着人工智能等高新技术的发展与普及,口常生活中产生和需要利用到的多是多值多标记数据,相比于单标记学习这类传统的监督学习,多标记学习显然更能满足实际生活的需要。在多标记学习中,每个样本常常同时归属于多个类别或者是具有多个标记。研究标记之间的相关性有助于解决多标记分类问题中随着标记数量的增多而带来的标记空间的膨胀、存储要求高、时间成本高等问题,提高多标记学习算法的预测性能和效率,使其具有广泛适应性。决策树算法是一个高效的能对数据进行分类并能提取相关分类规则的经典分类算法,但是应用于多标记学习问题中时没有充分考虑到标记之间的关系。基于以上考虑,文章在C4.5决策树和CART树的框架下提出了加入特征空间标记间相关性的多标记决策树算法(MLRDT和MLRCT),在MLRDT和MLRCT算法中进行分裂属性的选择时,将通过多标记数据集的特征空间得到的标记间相关性融入到衡量结点标记样本相似度指标的构建中,提出新的一致性和相似度指标,选择使得分裂前后结点的相似度差值最大的属性作为分裂属性。之后在上述算法的基础上加入样本标记集相关性,更新相似度指标的定义,更加全面地考虑结点数据集的标记相似度,得到上述算法的扩展算法(MLRDT1和MLRCT1)。另外,在处理连续值属性时,首先对属性值进行标准化处理,然后进行离散分组,即将属性值进行升序排序后分为K组,相应的将属性值在第k个区间的样本划分到对应的子结点中。文章选取7个数据集,并选取常用的多标记算法评价指标来评价算法的分类性能,实验表明,文章所提算法均取得了较好的实验效果。
其他文献
在抽水蓄能电站中,输水隧洞闸门井是引水系统的永久性主要建筑物,引水系统的正常运行和安全与其关系密切,而目前大部分的研究只涉及闸门井的结构设计和配筋设计,研究方向比较单一。因此,本文探索闸门井结构参数对应力状态和动力振动效应的影响是一项有意义的课题。本文依托工程算例,以某抽水蓄能电站引水事故闸门井为研究对象,开展了如下研究:(1)基于ANSYS平台构建了包含井筒、井座和围岩的闸门井有限元模型。在此基
汞,对生物和自然环境危害极大。燃煤电厂作为最大的汞排放源,故燃煤烟气中烟气汞的脱除一直是研究热点。在烟道中喷射改性活性炭脱汞的技术是当今较成熟且应用较多的技术。但是活性炭成本高,改性过程工序繁多,且因活性炭的孔结构无序和孔径分布复杂,在一些特殊工况下(如在烟气流速快,吸附剂停留时间短的环境下吸附),脱汞效率较差,脱汞速率较低。故有必要研究具有高比表面积、孔径分布均匀、孔径可调等特征的多孔碳材料从而
<正>一、调查研究与群众路线的内涵调查就是通过科学的方法尽可能全面地了解客观实际,获得大量的感性材料和各方面的信息,研究就是将调查的感性材料用马克思主义的立场、观点进行综合分析,研究事物产生、发展和变化的过程,认识事物的本质,发现事物的规律,从而为解决实际问题奠定理性基础。群众路线是一切为了群众,一切依
实现碳达峰、碳中和是我国对全世界做出的庄严承诺,实现这一目标离不开风电等新能源行业。但风力发电极强波动性和随机性的特点使得风电难以准确跟踪计划出力,此时储能的作用就至关重要,利用储能系统的灵活吞吐性能够有效提升风电场对计划出力的跟踪能力。首先本文对某风电场短期预测功率进行了数据分析,为确定一个功率变化率较小且较为平滑的曲线作为日前计划出力曲线,采取滤波平滑的方法对短期预测功率进行滤波平滑,通过对滤
太阳能资源以其普遍性、广泛性、清洁性、无污染等特点而被广泛应用于全球。我国的太阳能资源十分丰富,因此,在太阳能发电行业中进行大规模的投资,是调整能源消费结构、推动绿色经济发展的重要措施。随着国家政策的支持、社会经济的发展、技术创新的突破,越来越多的投资者投资光伏发电项目,促进光伏行业的发展。光伏发电装机容量快速攀升,但是也随之带来了一系列问题,投资者的盲目投资和扩张,一方面引发产能过剩的问题,加剧
企业自由现金流预测的准确度直接影响企业价值的评估,当前使用较多的自由现金流预测方法主观性较强,很大程度上依赖预测人员的个人经验和主观倾向,在非线性回归的企业自由现金流预测中,容易出现主观导向的预测结果。因此只能预测处于平稳期内的企业自由现金流,对于自由现金流变动情况较为复杂的企业,预测效果不佳。本文使用BP神经网络模型进行企业自由现金流预测,BP神经网络能够通过模型训练最大程度地逼近任意的非线性函
固体氧化物燃料电池(Solid Oxide Fuel Cell,SOFC)具有发电效率高和燃料来源广泛等优点,近年来受到能源领域学者和工业界人士的广泛关注。由于SOFC在高温、密闭性条件下运行,为了能够大规模实现商业化,必须要保证具有持续稳定运行的发电状态。因此,对SOFC电堆工作状态的监控以及故障预测成为SOFC发电技术研究的热点问题之一。本文对现有的SOFC故障预测方法进行了调研,提出了融合不
全球5G覆盖急剧增加,伴随着BTS(Base Transceiver Station,BTS)的强势引入,RRU(Remote Radio Unit,RRU)站的数量也随之增加。据华为统计,5G电站比4G电站多耗电70%,引发能源消耗过大问题。因此,高性能的电信电源将在降低功耗方面带来巨大的价值。扩展的RRU变电站就像一个收发卡,为天线提供电源(但它不会放置在变电站下方,而是放置在天线桅杆上方)。
目的探讨运动治疗和心理护理对慢性精神分裂症患者的康复效果。方法选取2019年6月至2020年10月聊城市第四人民医院收治的63例精神分裂症患者作为研究对象,采用随机数字表法分为观察组(32例)和对照组(31例),对照组给予常规药物治疗及常规护理,观察组在对照组基础上增加运动治疗和心理护理干预,干预期限均为4周。比较两组患者干预后总有效率、护理满意度,干预前后用患者生存质量问卷(pateint qu
建筑能耗和碳排放量未来将持续增长,推动产业绿色低碳转型已成为发展的必然趋势,在建筑中引入可再生能源提供部分电能成为重要的手段之一,“光伏一体式建筑”蓬勃发展。然而,光伏发电具有波动性和不确定性,配合使用储能系统能有效提高光伏发电的利用率并减少其对大电网的负面影响。相关研究发现,储能系统的配置成本是影响其经济性的关键,因此合理地配置储能系统的容量具有重要意义。目前对于居民用户侧储能系统的合理配置的研