Graph-NB:一种高效准确的多关系朴素贝叶斯分类算法

来源 :信息系统学报 | 被引量 : 0次 | 上传用户:welson926
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多关系分类是数据挖掘领域中的研究和应用热点。已有多关系朴素贝叶斯分类算法将所有与目标表相连的表都考虑在内,包括语义关系很弱的表。为此,本文提出一种新的分类算法—Graph-NB。它通过对表进行剪裁,达到优化语义关系图,从而一定程度上消除无关表对分类影响的目的。该算法实现了深度优先与广度优先两种遍历策略。实验结果表明,语义关系图的优化可以提高分类准确度和运行效率,相比于其他算法,该算法运行时间短,分类准确度高。 Multi-relational classification is a hot research and application area in the field of data mining. The Many-Matched Naive Bayesian Classification Algorithm takes into account all tables connected to the target table, including tables that have a weak semantic relationship. To this end, this paper presents a new classification algorithm -Graph-NB. It cuts through the table, to optimize the semantic relationship diagram, to a certain extent, eliminate the irrelevant table on the classification of the purpose. The algorithm implements two traversal strategies: depth first and breadth first. Experimental results show that the optimization of semantic relation graph can improve classification accuracy and operation efficiency. Compared with other algorithms, this algorithm has short running time and high classification accuracy.
其他文献
首先从内外成本结构出发,详尽分析了中小企业区域集优票据发行总成本的构成,即中小企业区域集优票据发行总成本由内外成本构成。其发行内部成本(正值),包括审计费、律师费、信
我国养老形势面临严峻挑战,而养老地产盈利模式不成熟,影响了养老产业的发展。笔者就养老地产盈利模式的盈利点、盈利对象、盈利源、盈利杠杆、盈利屏障进行了理论分析,并对
新经济形势下,我国保险业迎来了一个开放、融合、改革的良好契机,从而导致市场对复合型保险技能人才的需求急剧上升。结合保险新国十条发布、互联网金融、自贸区建设等形势,
介绍了钢铁料消耗计算口径与碳钢薄板厂钢铁料消耗现状,并提出了一些降低钢铁料消耗的措施,并在生产实践中取得了良好的经济效益。
期刊
11~9月农产品贸易额1353亿美元,逆差303亿美元1~9月,中国农产品进出口额1352.9亿美元,同比下降2.89/5。其中,出口额525.1亿美元,增长4.4%;进口额827.8亿美元,下降6.9%;贸易逆差302.7亿美元,下降21.5
随着“普九”的深入,农村中学的班额大,人数过多。初中一年级教学班一般在60人左右,有的超过70人。根据人教版英语教材的内容和要求,采用“交际法”教学很难按时完成教学任务。为
<正> 张××,男,38岁。1987年10月20日诊。患者十年前因精神失常而患癫痫,经住院治愈。近半年来,旧病反复发作,突然跌倒,不省人事,肢冷强直,痰涎壅盛,腹中沥沥有声,
回弹是板材冷冲压成形过程中不可避免的物理现象,也是难以控制的板材成形主要缺陷。回弹问题的存在严重影响着产品的成形质量和尺寸精度,特别是近年来由于高强度钢板和铝合金
近来,受英国脱欧与TPP协议等重大事件的影响,全球经济格局发生变动,这些经济政策的调整对中国经济有着深远的影响。因此,中国应主动自觉地了解最新世界局势,提前布置经济战略