【摘 要】
:
在监督分类中数据的不平衡性是导致各种分类算法效果不佳的主要原因之一,尤其在一些实际问题中,少数类被错分的代价极高,此时我们更关注对少数类的分类精度,为提升二分类不平衡问题中的少数类样本的分类精度,提出了不平衡数据最优比例重抽样与投影寻踪分类树算法相结合的分类方法.一方面基于重抽样技术和贝叶斯决策理论,通过最小化错分代价,得到不平衡数据集的最优重抽样比例,另一方面,利用投影寻踪分类树具有树结构简单,解释性强且分类精度高的优势,选择该算法作为基分类器进行训练.六组数据集进行实证研究,结果表明,本方法在不平衡数
论文部分内容阅读
在监督分类中数据的不平衡性是导致各种分类算法效果不佳的主要原因之一,尤其在一些实际问题中,少数类被错分的代价极高,此时我们更关注对少数类的分类精度,为提升二分类不平衡问题中的少数类样本的分类精度,提出了不平衡数据最优比例重抽样与投影寻踪分类树算法相结合的分类方法.一方面基于重抽样技术和贝叶斯决策理论,通过最小化错分代价,得到不平衡数据集的最优重抽样比例,另一方面,利用投影寻踪分类树具有树结构简单,解释性强且分类精度高的优势,选择该算法作为基分类器进行训练.六组数据集进行实证研究,结果表明,本方法在不平衡数据上有良好的分类效果,为不平衡数据分类研究提供了理论参考.
其他文献
随着物联网技术的快速发展,MQTT作为主要的物联网通信协议,在各种智能环境得到广泛应用.基于MQTT协议,对工厂生产实时数据传输架构、负责均衡、数据传输格式、数据压缩方式进行了设计,建立了测试环境,结合客户端异常中断等解决机制,实现了基于MQTT协议的工厂生产实时数据的传输.可为今后在偏远山区、网络状况不稳定、硬件性能低下、采集频率要求不高的场所,采用MQT协议传输实时数据提供可靠的技术支撑.
针对遵义医科大学新蒲校区现有的教材管理系统,根据现有的人工管理模式的教材订购、发放等步骤繁琐的问题,提出了一种基于云计算平台优化的教材管理业务流程方案.首先利用云服务平台部署管理系统环境,其次根据前期的调研报告设计了一个数据库来平衡该管理系统多重角色关系,并对教材征订与教材发放的影响因素进行了估计,最后针对教材的浪费引入了教材回收模块.该方案简化了教材管理员、教材科负责人与教材供应商的工作流程,提高了教材管理的效率.
高考志愿决定未来人生基础,秉承着这一原则,基于大数据层次分析汇总的数据集设计了一种高考志愿推荐算法,使得考生在保证报考院校成功录取的前提下,能够最大化的提升对报考考生分数的利用率,从而更加接近、达成考生对理想院校的期盼.算法部分首先通过分析招生院校在报考考生所在省份历年的招生提档线、批次省控线、以及招生排名等数据,然后利用论文提出的算法通过考生成绩、成绩对应的省排名与收集分类汇总处理的数据集进行逐一比对分析,加以细致化的处理计算,从而为考生合理的推荐院校,算法可以结合考生信息为其推荐院校.推荐院校结果显示
信息化发展背景下,各领域的发展中对信息化技术应用需求进一步提高,通过微信小程序应用,能够在病案的查询以及预约和复印相应的问题处理发挥积极促进作用,有效提升患者服务工作开展的质量效果,从这一基础工作方面得以强化,才能为实现既定工作目标打下坚实基础.主要从微信小程序应用的优势以及系统设计和主要功能加以阐述,然后就微信小程序应用的效果以及注意的问题和发展展望进行探究,希望能为实现工作的目标起到促进作用.
系统级诊断是多处理器系统故障诊断的一种重要方法,故障诊断能力是衡量多处理器系统可靠性的重要指标.在实际情况中,结点和链路都可能发生故障,衡量互连网络在混合故障下的诊断能力有h边容错t可诊断度,是指当故障链路不超过h时,系统能够保证定位到的最大故障结点数.但其诊断度为有限,为n-h.为了提高混合故障下的诊断度,增加了系统中所有非故障结点至少有1个完好的邻居结点的约束条件,提出了h边容错1-好邻居条件诊断度的定义,并证明了超立方体在PMC模型下的h边容错1-好邻居条件诊断度为2n-1-h,在最好情况时诊断度提
云计算技术日趋成熟,被誉为促进数字经济产业发展的关键驱动力和支撑力.在政府、企业等部门单位数字化转型过程中,大多数倾向选择多云或者混合云服务,在用户拥抱云计算带来的按需付费,弹性扩容、高可靠等技术优势的同时,如何有效做到快捷方便的多云管理将会给云计算用户带来重大挑战.针对多样化的云计算场景,提出一种一体化云管平台的设计思路,实现多云资产的管理,仅供参考.
CINRAD/SA多普勒天气雷达作为我国新一代天气雷达组网的主要雷达,在气象短时预报、临近预警预报等方面发挥了重要的作用,为提高一线机务人员的维修保障能力,通过详细介绍CINRAD/SA雷达波导开关的内部结构,分析了其工作控制原理,并通过一次波导开关故障的处理修复过程,总结了波导开关相关故障的通用处理流程,并对这类故障的原因进行简单分析,提出了一些在平时维护维修中需要的注意事项,为其他台站在遇到类似故障时能及时有效的解决问题提供参考,从而更好的保障新一代天气雷达正常运行.
心电图是检测心律失常的重要工具.传统心电信号分类方法有着复杂的特征提取任务,无形中会增加计算量.为避免复杂的特征提取任务并且提高心律失常的识别率,提出一种由四层卷积层、三层池化层以及两层全连接层构成的卷积神经网络模型.经过训练和测试,基于卷积神经网络的心律失常识别的总识别率达到99.49%,正常搏动N、左束支传导阻滞L、右束支传导阻滞R、室性早搏V、起搏心跳/、未分类心跳Q以及心室颤振波!的识别率分别达到99.82%、99.34%、99.22%、96.96%、99.55%、100.00%、87.80%.相
在信息化时代迅猛发展的当下,各种先进的信息技术以及智能设备层出不穷,比如VR技术、5G通信技术、智能手机、PDA等移动终端设备,有效推动了移动医疗系统的发展与完善.在未来,移动医疗系统功能将会越来越强大,“足不出户看病”“远程诊断手术”等将会逐步全面照进现实.在简单介绍了何为移动医疗后,分析了移动医疗的架构,并从多方面入手,着重分析了移动医疗实践,并提出了一些移动医疗在医院信息化建设中的实践策略,以供参考.
在大数据背景下实证检验了媒体信息关注对企业是否收到问询函的影响.研究发现,媒体信息关注越多的公司收到问询函的概率越大;利用大数据智能化的新闻舆情数据,通过文本分析度量媒体信息关注的具体内容和语调情绪来看,媒体报道信息越详细,负面报道越多,上市公司收到问询函的概率越大.研究结论表明,大数据时代的海量信息源中,媒体信息关注仍可在资本市场监管中发挥积极的信息中介作用,对强化证券监管和保障信息安全具有重要启示.