【摘 要】
:
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类
【基金项目】
:
重庆市科技攻关资金资助项目(CSTC,2009AC2068).
论文部分内容阅读
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。
其他文献
本文指出联网和共享应用软件会改变测试仪器的设计方法,其中包括仪器的应用软件.一个面向对象的模型很容易实现应用软件的共享和对于数据库的网络支持.这些将成为未来仪器的
变电设备是铁路牵引变电的重要设备,其主要作用是向电力机车提供牵引所用电能,其对于高速铁路安全、稳定运行具有十分重要的作用.本文对铁路牵引变电设备中存在的问题进行了
通过对某住宅门厅独立柱基础回填土地基进行注浆加固的设计、施工的介绍,分析了袖阀管注浆的加固原理,介绍了袖阀管注浆施工工艺流程,总结施工中的经验,取得了很好的加固效果
给出了一种改进的迭代算法,可用于求解变分不等式和平衡问题,并证明了此迭代序列的强收敛性;推广了文献[1]和[3]的结果.
在海量数据的关联规则数据挖掘中,采用并行计算是非常必要的;针对当前的关联规则算法,运用并行算法的思想,结合云计算环境下的Hadoop架构,提出了Hadoop下的并行关联规则算法