基于图结构挖掘算法的研究与应用

被引量 : 0次 | 上传用户:lairr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对着迅速增长的数据信息量,人们受到“信息爆炸”的巨大压力的同时又陷入“数据太多,知识太少”的窘境。数据挖掘技术的产生与发展为人们摆脱这种困境提供了强有力的手段。数据挖掘本质上来说是让数据自己说明自身的价值,即是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。在整个数据挖掘的研究中,算法的研究占有特别重要的地位。一方面,数据挖掘面对的是大数据集(称海量数据),因此算法的效率将对其应用起关键的作用;另一方面,我们面对的计算机系统在其性能上远远不能满足对大数据集进行处理的要求,因此我们必须研究和改进现有的算法使其有更广泛的应用前景。再者,由于近年来生物信息技术、网络开发技术的迅速发展,越来越多的人们意识到用图能更好地描述事物之间的复杂关系,进而在此基础上进行挖掘可以得到更多的有用信息。鉴于此,本文选择了对图结构数据挖掘算法进行研究。本文对数据挖掘中的图结构挖掘算法作了比较深入的研究。Jiawei Han等人针对类Apriori算法(如FSG、AGM、AcGM)连接和剪枝耗时很大的缺点,提出了gSpan算法和CloseGraph算法。gSpan算法和CloseGraph算法相对于类Apriori算法是比较好的算法,它们通过引入新的方法和概念——DFS Lexilographic Order、最小DFS code和最右扩展,使得无需按Apriori算法的思想而是直接生成频繁子图,大大提高了算法的效率。但它们也存在以下问题:挖掘结果集中考虑了图的标记,即具有不同标记的图被认为是不同的图。而很多情况下,标记不同的图具有相同的结构。基于前人的研究,本文提出了两个新的算法——极大完全子图挖掘算法(MaxcodeFMCG算法)和频繁子图结构挖掘算法(FSA算法),并将MaxcodeFMCG算法与已有的频繁模式挖掘算法FP-Growth算法相结合,产生了一种基于图结构的频繁模式挖掘算法(MaxcodeFP-Tree算法)。MaxcodeFP-Tree算法的主要优点是解决了FP-Growth算法中存在的内存不足的问题。FSA算法则主要是解决了以往的频繁子图挖掘算法中存在的“标记不同但结构相同的图被认为是不同的”的问题,有利于对结构挖掘进行更深入的研究。最后,本文对gSpan算法和FSA算法的频繁子图情况进行了比较,通过大量的实验结果表明,FSA算法在一定程度上优于gSpan算法。
其他文献
本文以在我省新建的大型电站网控仿真机为背景 ,阐述了基于规则推理的电气防误操作评价系统的结构及建立过程 ,并给出了产生式规则库的具体形式。 Based on the newly built
文章通过总结国际先进环保园区的典型案例,对比我国环保产业园的发展现状,总结了环保园区国际化发展面临的困难和挑战。结合国家战略及环保产业园区的性质,对未来的发展提出
经济是颜面,人才是关键,创新是动力,文化是灵魂。商业企业文化是商业企业的人格化,是商业企业成员思想行为的精华,它是一群人共同生活的方式,也是共同认可价值观的体现。它只
景观都市主义的兴起与发展重拾了景观的内涵与意义。景观作为一种“媒介”,能有效地调和城市更新所面临的复杂性与多元性等问题,持续刺激和引导城市走向渐进式的有机更新。该
基于2008年3月~2016年3月全国23个省份面板数据,测算了省份之间、区域之间以及区域与全国之间生猪价格波动的同步系数,并据此分析了中国生猪价格的区域协动性及生猪价格波动
以甘薯品种白星为材料,设置5个硅元素水平(0、0.5、1.0、1.5和2.0 mmol/L),探讨了硅对甘薯前期生长特性和主要矿质元素积累的影响。结果表明,在参试浓度范围内,处理21 d后,甘薯
<正>第三批上海市工艺美术大师颁证会于7月30日在上海工艺美术博物馆多功能厅召开。2014年第四季度开展申报工作,共有102人在网上提交申报材料,经初审79位申报者符合申报条件
期刊
本文论述在抗日战争时期,延安鲁艺的音乐家试图寻求一条适合中国音乐创作的道路,最终,他们以民间音乐为载体,创作出为大众喜闻乐见的、具有时代气息的音乐作品,为我国近现代
组成型热休克蛋白70-4(heat shock protein 70 cognate 4,HSC70-4)是HSP70家族的重要成员,对蛋白质的正确折叠与转运有着重要意义。本研究以中华蜜蜂转录组数据中获得的HSC70-4
<正> 问题的提出小学与中学是我国基础教育的两个阶段,它们彼此独立又相互衔接。然而在教育实践中,中小学在教育、教学工作中又常常存在着相互脱节的现象,由此而造成部分学生