邻域粗糙集算法改进及在多晶硅数据的应用

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:greenplastic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国光伏制造业的迅速发展,多晶硅电池凭借其较高的性价比一直占据着光伏市场的主导地位。多晶硅的少子寿命值是保证多晶硅电池性能的关键因素,而少子寿命值主要取决于多晶硅的生产工艺和配料种类。目前我国已经有了相对成熟的多晶硅生产工艺流程,所以对最终少子寿命值影响较大的是生产所使用的配料种类,有效合理的配料种类可以达到节省成本和提高少子寿命值的目的。但是随着数据量的不断增加,对多晶硅配料数据的处理过程往往伴随着巨大冗余属性和时间消耗。因此如何快速有效的获取数据中的潜在信息成为了当前研究的一个热点。粗糙集是一种有效的数据信息处理工具,能够从海量数据中高效的提取出我们所需要的信息,已经在工业领域得到广泛应用。但传统粗糙集只能处理离散型数据,无法直接处理连续型的多晶硅配料数据。为解决此问题邻域粗糙集被提出,可以不需进行离散化处理,直接用于连续型数据。而传统邻域粗糙集在对工业数据进行分析时,仍存在计算结果不准确、算法复杂度过高等问题。为提高属性约简质量及减少算法运行时间,本文从以下四个方面对其进行改进:(1)传统的邻域粗糙集只将条件属性进行邻域粒化处理,对于连续型数据的决策属性,仍将其看作等价类别处理,这将产生过拟合现象。本文将邻域粒化概念引入决策属性中,通过对每个决策点进行邻域划分,将每个区域内的所有点看作一个类别来进行计算。这样既解决了过拟合问题,又提高了计算结果的可靠性。(2)由于传统邻域粗糙集对下近似的判别依赖严格的包含关系,使属性约简结果过于依赖由邻域半径所划分的邻域,这导致所有被正确分类的邻域无法全部为决策做出贡献。针对此问题,在交叉关系基础上,提出了新的下近似计算方法,并将其定义为下近似贡献度,提高了下近似计算的容错性。本文采用4组UCI数据及2组多晶硅配料数据进行实验,结果表明,新的下近似计算方法可以得到更高的邻域近似质量,提高了属性约简的可靠性。(3)传统邻域粗糙集的重要度权重阈值一般为固定值,使某些属性重要度很低,但重要度权重却大于该固定阈值的属性,被归为核属性。而这些重要度低的核属性对决策的划分几乎无影响。针对此问题,提出了自适应-β重要度权重阈值方法,在属性重要度计算结果基础上,将每个属性权重从大到小排列,首先取属性权重最小的作为重要度权重阈值,通过提出的评价函数计算其评价值,以此类推,最终选取评价值最高的阈值,作为最终结果。在4组UCI和2组多晶硅配料数据上实验,其结果表明,该方法可以得到更高的约简率和分类精度,提高了工业数据分析的准确性。(4)传统邻域粗糙集邻域半径一般采用经验值或者反复实验来获得,降低了工业数据分析的自动化程度。本文采用邻域粗糙集-支持向量机(Neighborhood rough setssupport vector machines,NRS-SVM)模型,对多晶硅数据进行属性约简及预测。针对该模型在处理多晶硅铸锭配料的连续型数据中邻域半径和SVM参数的取值问题,提出将NRS-SVM模型与遗传算法(Genetic algorithm,GA)相结合的两阶段遗传算法。该算法的第一阶段通过搜索新的邻域半径来得到较好的约简集合,第二阶段采用第一阶段属性约简结果,通过搜索新的SVM参数来训练出准确率较高的分类模型,算法根据每个阶段的目的提出了相应的适应度函数及终止条件,该方法的显著特点是实现了NRS-SVM自动化特征提取及分类预测,并将两个阶段单独进行,避免了通过分类器来评价约简性能所带来的时间消耗。在多晶硅铸锭配料数据集上进行实验,结果表明,与一阶段遗传算法相比,该方法运行时间短,输出结果稳定,可得到较少的特征和较高的分类精度。
其他文献
增加原煤的洗选率是提高煤质的重要途经,也符合当今煤炭资源清洁高效利用的趋势。在原煤入洗前,需对原煤中粒径较大的矸石进行分选处理,以达到后续破碎和洗选的要求。传统的煤矸分选主要由人工完成,存在着劳动强度大,分选效率低的问题。为了实现煤矸分选的自动化,本文研究设计了一套基于机器视觉的煤矸智能分选系统,该系统主要由负责采集图像及进行动态测试的煤矸分选平台、负责图像识别与定位的上位机煤矸分选软件以及控制执
强化学习技术用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。深度强化学习是强化学习的进一步发展,用以应对更加复杂的环境。多智能体环境是一种常见的复杂环境,在这种环境中深度强化学习的训练成本通常十分高昂,这极大的阻碍了深度强化学习的技术发展和应用推广。迁移技术是一种可以有效降低多智能体深度强化学习训练成本的技术,它是指将某个领域或任务上学习到的知识或模式应用
高精度压力传感器是现代航天航空领域中十分关键的核心器件,也是航天器大气数据检测系统对压力进行准确检测的重要保障。双“H”型硅谐振式压力传感器由于尺寸小、重量轻、精度高以及双频自补偿输出和抗干扰能力强等优点,因此,双“H”型硅谐振式压力传感器的研制在压力传感领域中受到了广泛关注。相比于传统振动筒式(谐振筒式)和单梁谐振式等压力传感器,双“H”型硅谐振式压力传感器在重量、体积和精度等方面优势显著,但是
量子机器学习是将量子计算的基本特性应用于机器学习所产生的一门交叉学科。将量子态叠加原理以及量子并行算法等加速算法应用在机器学习上,可用以解决当前面对大数据时代激增的数据量,传统的机器学习训练过程缓慢等困难,从而实现对传统经典算法的加速。该领域的研究不仅可以推动机器学习的快速发展,提高数据挖掘分析学习效率以及学习精度,同时也可以推动量子算法在经典算法中的应用。目前在该领域的研究不仅是提出量子无监督聚
光纤环衰荡光谱作为一种高灵敏度的技术,可以实现样品的折射率、浓度等参数的测量,近年来受到研究者广泛关注。对于脉冲光纤环衰荡系统,脉冲一般由强度调制器、激光光源和信号发生器组成。脉冲的频率和宽度需要折中考虑,所以需要考虑光纤环的长度,而较窄的脉冲宽度也对环衰荡时间有较大的影响,混沌激光技术可以很好的解决这个问题。本论文研究基于化学腐蚀法的光纤传感器实现混沌相关光纤环衰荡传感,采用混沌光纤激光器作为激
近些年来,在我国政府大力重视“新基建”发展的背景下,智慧交通行业成为了“新基建”的关注焦点之一,其中编队驾驶技术成为车路协同系统中重要的技术热点和前沿课题。编队驾驶技术不仅在缓解交通拥堵、提高道路通行能力、降低环境污染和提高驾驶安全等方面具有关键意义,同时为智能网联交通系统的发展提供理论基础和技术支撑。目前随着国外戴姆勒集团等企业开始研发编队行驶,国内以百度、一汽等为首的互联网和传统造车企业也开始
目前西山晋兴能源斜沟矿产能达到了1500万吨/年,开采技术处于国内先进水平。随着矿井工作面的逐年不断延伸,各类机械电器设备有了更多的投入,生产队组组织结构建设和人力资源也是每年有若干变化。但信息管理方法依旧是靠各部门管理各自的办公资料,用电脑word,excel来辅助文字数据处理,这种传统的办公信息管理方法,不仅在部门与部门之间数据共享繁琐易出错,工作资料备份易丢失,致使工作效率低下,而且不能快捷
本文构建了社交型互联网企业国际化投资的社会责任风险管理框架,从独立运营主体与商业运作平台两个维度,深入分析字节跳动国际化投资的社会责任风险及其管控措施,提出建议:政府应规范底线责任,反制数据隐私保护滥用;行业应实现多主体携手监管,促进企业间公平运营;企业应把握主体与平台运营差异,多角度完善社会责任风控等。
本文利用变分法研究了两类非线性Choquard方程约束解的存在性.首先,研究了带组合非线性项的Choquard方程约束解的存在性.其次,研究了带L2-临界指数的分数阶Choquard方程约束基态解的存在性.主要理论依据有极小化序列的方法,消失引理,极小极大原理,Hardy-Littlewood-Sobolev不等式,Pohozaev恒等式以及一些分析技巧.首先,研究如下带组合非线性项的Choqua
近日,中国初级卫生保健基金会(以下简称“初保基金会”)爱无限健康公益基金收到了三封患者来信。他们分别由甲型血友病FVIII基因杂合突变、进行性假肥大性肌营养不良DMD和脊髓肌萎缩症单基因病患者家庭书写。字里行间,有一些正能量使我们深受触动,信中提及的事迹让我们温暖满怀。
期刊