知识发现的图模型方法

被引量 : 66次 | 上传用户:jianghui123789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为概率论和图论相结合的产物,图模型理论为解决应用数学和工程中的 不确定性、复杂性问题提供了直观而自然的方法。近年来它逐步成为数据发掘 与知识发现领域中一个不容忽视的方向。根据“基于有向图模型的知识发现” 框架,本文研究图模型在知识发现领域的应用理论基础,包括离散化预处理、 结构学习、参数学习、模型解释等四个方面。 首先,本文分别提出了连续数值属性的无监督离散化算法和有监督离散化 算法。无监督离散化算法基于混合概率模型,它能够在缺少先验知识和参考属 性时自动离散化数值区间:首先建立属性值的混合概率模型,然后采用EM算 法来确定该模型的参数,最后利用贝叶斯因子寻求最佳区间数目。有监督离散 化算法-力权信息损耗离散化算法,是决策树离散化算法的一种扩展,但采用 了ChiMerge算法中的自底向上离散化方式。 然后,本文从概率密度函数逼近的角度对有向图模型的结构学习进行了理 论分析,归纳出“最大相互信息原则”,分析了运用该原则进行结构学习时的 性质,并提出了“附加惩罚函数的最大相互信息原则”,进而提出了有向图模 型结构学习的演化算法,该算法可以结合两类先验知识以提高学习效率,并设 计了一系列修正算子,以保证由已有拓扑结构繁衍出的新结构仍然是符合要求 的拓扑结构,而且不违背先验知识。 针对有向图模型的参数学习,本文提出基于复合计算智能的方法,设计了 各节点处条件概率密度的人工神经网络表示方法,使得参数学习时不再要求参 数满足局部无关性,也不再需要用户指定先验参数,进而提出了该人工神经网 中国科学院博士学位研究生学位论文 络的演化训练算法,从而确定有向图模型各节点处参数的值。 此外,本文还探讨了有向图模型的模型解释问题,分别提出了概率依赖关 系描述、条件独立关系的自然语言描述方法。 最后,本文介绍了一个概率依赖关系发现系统原型工具Dr.Miner的设计和 实现。
其他文献
八十余年前的秦淮河是什么样子?在白话大家朱自清与俞平伯的同题散文名篇《桨声灯影里的秦淮河》里有所描写。同一个月夜,朱先生的文字里,秦淮河是缠绵里多含有眷恋悱恻的气
日本当代女作家吉本芭娜娜小说中的主人公、引导性角色几乎都是女性。如《月影》、《厨房》、《厨房2——满月》便是如此。其女主人公具有以下共同特性:精神空虚孤独、寻找心
随着我国城市化进程的不断加快,建筑事业也在日益的发展与完善,但是由于我国能源紧缺,且人类对建筑行业的需求越来越大,这不得不促使我们加强对建筑节能施工工艺的研究,而混凝土工
美国两学者近日发文说:中国虽无中亚大战略,却无意间成就了中亚帝国,将在地缘政治上冲击美国和西方在地球上最重要地区"世界岛"的影响力。此论既不尊重事实又不公正。由此而
目的:研究颈康胶囊的处方、制备,并观察其临床疗效。方法:颈康胶囊由乌梢蛇、羌活、土鳖虫、川芎等10味中药经数道工序制得,并做定性鉴别。对临床642例颈椎病患者作临床观察
法律行为曾被称为"大陆法系民法学中最辉煌的成就"。意思表示乃法律行为的核心。但意思表示除了健全的意思表示外,还有瑕疵的意思表示。它直接关系到法律行为的效力。大陆法
通过在基片下放置磁铁在放电空间中引入垂直基片方向的磁场,磁性靶的溅射变得更加容易。与此同时,沉积薄膜的一些物理性能发生了变化,并且发现这种效果也同样出现在溅射非磁性靶
通过对中亚国家发展进程的纵向考察与横向比较,文章从中亚国家发展进程的总体特征——矛盾性和脆弱性以及发展态势——多样化和碎片化入手阐述了中亚国家发展的共性和特性。
美国著名作家塞林格的经典之作《麦田里的守望者》,对美国社会以及20世纪以来的世界文学产生了深刻的影响。纵览整部著作,其最大的特点不仅仅是那个能够以其独特的个性、经历
<正>B.19631979年进入清华大学建筑系清华大学建筑学院教授李晓东工作室主持建筑师2012美国建筑师协会荣誉院士2012世界建筑节文化建筑大奖2010阿卡汗建筑奖2009英国AR+D新锐