【摘 要】
:
分类(Classification)是数据挖掘和机器学习中最重要的问题之一。因为贝叶斯(Bayesian)算法具有坚实的数学理论基础,所以它有着很好的分类效果,并且一直是分类算法中的重要算
论文部分内容阅读
分类(Classification)是数据挖掘和机器学习中最重要的问题之一。因为贝叶斯(Bayesian)算法具有坚实的数学理论基础,所以它有着很好的分类效果,并且一直是分类算法中的重要算法。但是在数据挖掘和机器学习的实际应用中,对数据仅有一个准确的分类是远远不够的。一个准确的排列(Ranking)算法在实际应用中往往是需要的,并且其重要性甚至超过了一个准确的分类算法。因此,将贝叶斯方法应用于Ranking的研究是一项有趣的工作,并且具有十分重要的意义。本文在Weka试验平台的基础上搭建了用于Ranking实验的实验平台。在这个平台上实现了朴素贝叶斯(NB),树扩张贝叶斯(TAN),贝叶斯树(NBTree),隐藏贝叶斯(HNB)和AODE分类算法。通过对这些分类器的Ranking效果的比较我们发现,由于没有充分考虑非类属性相对于类属性之间的重要程度,AODE分类器在某些数据集合上Ranking的效果不太理想。WAODE算法通过增加权值的办法,克服了AODE分类算法的缺陷,改善了AODE算法的分类效果。于是本文尝试将WAODE分类算法应用于Ranking。在Ranking实验平台的基础上,本文对上述六种算法进行了试验。试验结果表明,在35个UCI标准数据集合上,WAODE算法(AODE的拓展分类算法)在Ranking上的效果确实要优于AODE算法,尤其是在大数据集合的情况下,这种优势更加明显。并且WAODE分类算法在实验中的表现是上述六种分类算法中最好的。
其他文献
问:在《语文学习》2009年第2期镜头栏目里看到一篇《鱼儿为何翔浅底》的文章,作者在分析“鱼翔浅底”中的“翔”字运用之妙的时候提到这是移就的修辞。作者还给出了该修辞的
拨叉类零件是汽车变速器中挂档的重要零件,拨叉装配是汽车零部件开发中的重要环节,装配品质的好坏、对错直接反映在整车的性能和品质上。人们对汽车的安全性能要求比任何其他
消防设计中不能死抠规范条文,要根据规范的适用性和优先级来总体把握,合理设计。在保障安全的前提下,消防设计还要做到经济适用,不要人为放大设计参数。对于"地下车库+地上高
MYB转录因子是植物中最大的转录因子家族之一,在植物生长发育的各环节发挥重要作用。植物花发育是植物生殖生长过程中最为重要的过程。我们通过对大量文献的总结,简要综述了M
黑龙江省大兴安岭地区黑龙江上游段漠河至呼玛江段平均每3-4年发生一次冰坝灾害,每次都会给我国沿江村镇造成巨大的损失。为了服务于防汛工作,为地方政府抗凌决策提供数据支
吕田大芥菜是广州市从化区"一村一品"特色蔬菜,种植规模大、经济效益好,享誉粤、港、澳地区,是当地的特色产业蔬菜品种。文章规范了吕田大芥菜优质、安全的生产技术。
民事执行难是人民法院执行工作中的焦点问题,也是全社会普遍关注的一个热点话题,它不仅关系到当事人的合法权益能否实现,还是一个国家法治水平的重要标志。本文结合法学基础
目的:探索藏药麻黄灰对过敏性鼻窦炎临床药效;方法:用麻黄灰粉治疗10例过敏性鼻的临床疗效观察;结果:10例中痊愈6例,占60%;好转3例,占30%;无效1例。总有效率为90%;结论:麻黄具有
前言本文通过对一所大学附属综合性三级甲等医院15个临床科室连续5年的卫生资源投入、产出及配置情况等方面的研究,筛选出针对临床科室相对效率评价中具有重要性、代表性、可
通过对自然权利说的反思,认为该学说不足于为权利的来源与基础提供一套坚实可证的解释,尽管其结论是可取可用的。人权不是冥冥之中安排预设好的,和其他理念和制度一样,是人类