【摘 要】
:
数据挖掘的目的是通过运用特定的算法,从大量数据中发现有用的规则和模式,并用于描述和预测。贝叶斯网络是一种描述变量间概率依赖关系的有向无环图,它提供了一种自然的表示
论文部分内容阅读
数据挖掘的目的是通过运用特定的算法,从大量数据中发现有用的规则和模式,并用于描述和预测。贝叶斯网络是一种描述变量间概率依赖关系的有向无环图,它提供了一种自然的表示因果信息的方法,是目前不确定知识表达和推理领域有效的理论模型之一,常被用于进行数据挖掘的分类任务。在贝叶斯网络结构学习中,如何优化现有的网络结构搜索算法,进而构造更优的贝叶斯网络,从而提高其应用在数据挖掘分类上的性能,是研究的热点之一。本文对贝叶斯网络的优化所进行的研究工作主要包括以下几个方面:(1)简述了贝叶斯网络的起源、发展,并详细介绍了贝叶斯网络的国内外研究成果以及当前的热点研究方向。(2)对贝叶斯网络的主要研究方向进行了分析和探讨,包括网络的表示及特征、结构学习、参数学习及推理的原理和方法,重点针对网络的结构学习,分析和比较了基于评分和基于条件独立性测试的方法的原理和特性,并分别列举了一些典型的算法及其主要特征。(3)针对基于评分的结构学习方法中的搜索算法进行了研究和探讨,介绍了常用的不同启发式搜索算法的原理和流程,分析了算法各自的优缺点,并介绍了遗传算法用于网络结构搜索的原理和具体实现过程,分析了此算法存在的缺陷。(4)提出了一种基于模拟退火的遗传搜索算法——SA-GS搜索算法,该算法在遗传搜索中引入了模拟退火的思想,在每一次的遗传搜索结束后进行降温,然后在新的温度下再次进行遗传搜索,直至达到终止温度,并在每一次由子群体生成新一代父种群的过程中,以一定的概率来接受评分较差的网络结构。(5)为验证SA-GS搜索算法的性能,通过NetBeans对算法进行了编码实现,并在Weka实验环境中,通过其自带的4个数据集来对使用不同搜索算法构建的贝叶斯网络的分类性能进行了测试和比较。实验结果表明,SA-GS搜索算法能够比遗传搜索多出1到2个正确分类的实例,从而提升了遗传搜索的性能,但随着属性数目的增加,如何提高算法的运行效率,仍需进一步的研究和改进。
其他文献
高职院校作为为社会培养和输送高素质应用型技能人才的主阵地,承担着发展高职教育的重要责任和使命。现如今,高职院校担任实践实训课程的老师多数是来自行业、企业一线的、拥
科技进步能够促进经济增长,所以各国政府都非常重视科技投入。但行政区域的独立性使地方政府间表现出财政支出策略性行为,那么,地方政府在科技投入上是否同样存在策略互动?如
多环芳烃是一类典型的持久性有机污染物,具有高毒性、高生物富集性和难以降解等特点,其中,芘因其具有稳定的四苯环结构,成为研究高环芳烃的代表性有机物。环境科学技术领域的研究热点一直是多环芳烃的微生物修复法,这种修复方法的运行费用低、对环境没有干扰,广泛应用于环境中多环芳烃的去除。自然环境中存在的多环芳烃降解菌虽然种类丰富,但由于自然环境中污染物分布并不集中,细菌在自然条件下对多环芳烃污染物的降解能力有
生态语言学是一门新兴学科,国内生态语言学起步较晚,需要借鉴国外相关研究成果,因此对国外优秀学术论文的翻译就显得尤为重要。译者选取了著名语言学家斯特芬森和菲尔2014年发表的生态语言学论文《生态语言学:研究现状及发展趋势》作为本实践报告的翻译文本。该篇学术论文具有极高的学术性、专业性、严谨性和精准性特点,也给本次翻译实践带来难点。翻译难点具体体现在三个层面:(1)词汇层面,疑难学术术语使用较多;(2
粘弹阻尼道床是受约束阻尼结构的启发所发明的一种新型的道床减振方式,结构主体是由道床(约束层)、基层和由粘弹阻尼材料组成的阻尼层构成。但在实际工程中,列车往往因紧急制
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。知识获取瓶颈问题是制约词义消歧技术发展的重要因素,现存多种
可见光通信(Visible Light Communication,VLC)技术因其绿色环保且不占用传统无线电频谱资源,近年来受到了中外学者的广泛研究和各国政府的大力支持。为了满足光线亮度的需求
城镇化问题在中国争论了几十年,从大拆大建的造城运动到十八大以后倡导以人为本的新型城镇化改革,这期间经历了从对地的城镇化到对人的城镇化的转变。不管是“成都模式”、“
本文是一篇英译中模拟交替传译实践报告,选取普林斯顿大学出品的访谈类节目——《国际座谈会“奥巴马医疗改革:神话还是现实”》为模拟交传案例,分析目的论原则在访谈类节目
针对柔性关节空间机械臂动力学建模与仿真问题,以空间三维四连杆柔性关节机械臂模型为研究对象,考虑扭转弹簧非线性刚度系数、惯性耦合等因素,应用Lagrange方程建立动力学模