【摘 要】
:
由于数据集里类别分布不均,传统随机森林(Random Forest)分类器的性能受到一定程度制约,面对学业数据集中成绩较差人数占少数比例的非平衡性问题,为了在一定程度提高模型预测
【基金项目】
:
国家自然科学基金青年科学基金项目“基于排队网络模型的机场群航班时刻资源优化配置关键技术研究”(61603396)
论文部分内容阅读
由于数据集里类别分布不均,传统随机森林(Random Forest)分类器的性能受到一定程度制约,面对学业数据集中成绩较差人数占少数比例的非平衡性问题,为了在一定程度提高模型预测性能,提出SMOTEENN混合采样方式结合随机森林分类器的组合分类预测模型的方法(SER)对学生学业表现进行分类;同时基于10种非平衡性数据集采样方法,对比分析了包括随机森林在内的5种模型的性能.实验结果表明,使用SER方法对学生学业表现情况预测最优,分类器性能指标F1-Score和Recall的值分别为0.98和0.97,达到了
其他文献
采用田间试验的方法,研究了高碳基肥料对舞阳烟区土壤肥力、微生物特性、初烤烟叶化学性质以及香气物质含量的影响。结果表明:高碳基肥料在移栽后30 d,显著提高土壤碱解氮、
自贸试验区的设立和发展是中国政府的重要战略举措之一,具有极其深远的意义。要充分发挥现有自贸试验区示范带动、服务全国的积极作用,必须及时总结评价试点实施效果,对政策
岩石变形破坏特性是寒区岩土工程建设所直接面临的基础力学问题。为模拟冻融与荷载作用下岩石变形破坏的全过程,将冻融-荷载作用下的岩石微元在轴向抽象为未损伤、冻融损伤、
在国际物流领域,有这样一家企业:首先,他是一家“百年老店”,全球领先,每天约有超过40万名员工共同参与1830万票的包裹和文件递送工作;其次,他不只是一个快递企业,还是一个供应链服务
详细介绍了对一座综合性特殊高档商用建筑进行声学设计的全部内容。为声学设计全面进入民用领域进行了有益的探索。
本文的研究目的是剖析爱在教育中的重要性、必要性。方法:呈列、论证、借鉴法。结果和结论:幼儿教育专家总结到:“讽刺中成长的孩子学会羞怯;羞辱中成长的孩子学会内疚。”这
内容简介:进入21世纪后,曾经长期威胁人类生存发展的瘟疫、饥荒和战争已经被攻克,智人面临着新的待办议题:永生不老、幸福快乐和成为具有“神性”的人类。在解决这些新问题的过程
本文以粮、棉、油作为敏感产品采取不同的关税削减方案,模拟中国与周边地区建立自由贸易区对我国棉花生产、进出口和棉农就业的影响。研究认为,自由贸易区所带来的双边贸易的
落实从严治党责任要根据高校中心工作的特殊性和职责功能定位,根据《中华人民共和国高等教育法》和《中国共产党普通高等学校基层组织工作条例》规定,给予高校履行相应职责营