基于样本冗余控制的材料属性机器学习预测模型

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:yjcwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,提出一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此
其他文献
随着移动互联网技术的不断发展,传统教育教学模式也逐渐地发生改变。高职院校传统思政课堂模式存在着内容形式 简单、教学管理困难和教学评价反馈形式单一等问题,在移动互联
地方性砷中毒是因自然界环境中含砷量过高所引起的生物地球化学性疾病。地方性砷中毒在世界范围内流行广泛,已成为一种世界性的严重威胁人类健康的公害病。目前世界上有许多国
新企业所得税法已于2008年1月1日起正式实施.如何深刻理解新企业所得税法的精髓.有效规避企业的涉税风险,是税收筹划必须考虑的问题。本文主要从税收筹划空间的变化提出了税收筹
目的:探讨胸段食管癌腹腔淋巴结转移规律及影响腹腔淋巴结转移的因素。方法:对212例单纯手术切除的胸段食管癌患者的临床资料进行回顾性分析。结果:全组腹腔淋巴结转移率31.1%(66
恶性肿瘤是目前危害人类健康的常见病、多发病,并已成为我国人口第二位死因。因此恶性肿瘤的防治成为当前卫生工作的一个重要课题。本文通过对阿克苏地区某综合医院2002~2005年
本文运用经验研究法,以我国零售业50多家上市公司219个样本。对该行业股票收益率决定因素进行实证分析。较之以往研究,本文作如下改动:前研究表明市场风险系数始终未表现出对股
目的:研究锁骨不愈合的临床特点,评价带血管蒂的骨瓣转移植骨内固定术的治疗效果。方法:选择25例锁骨骨不连伴骨缺损的病人,分别采用3种手术方法,17例无明显骨缺损的骨不连患者采
内部财务制度是企业管理制度的有机构成部分,现代企业管理中完善财务制度防范财务风险的基础。文章认为,现代企业制度的财务管理模式应是建立以财务预算为前提,以资本管理和成本