不确定图下的稠密子图挖掘研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:yecongliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网与信息技术的高速发展,各行各业产生的数据也随之增多,这些数据往往能产生巨大的价值,如何挖掘其背后隐藏的核心数据成为了信息技术圈的核心议题。图作为一个经典的数据结构,由于其在描述数据及结构特性等方面的显著优势,被广泛使用在社交网络、本文检索、生物信息等领域。使用图来描述的数据信息被称为图数据,而挖掘图数据中有价值的、隐藏不为人所知的信息则称为图挖掘。在实际应用中,由于数据来源的差异及技术手段的限制,会导致图数据的不精确甚至缺失,不确定图被提出用来表示这种含有不精确信息的图数据,在针对种类数据进行分析处理时必须兼顾不确定性,因此针对不确定图的挖掘问题称为了图挖掘领域的新难题。稠密子图作为一个图中内部边相对密集的子区域一般被视为图的核心部分,如何从不确定图中挖掘出稠密子图具有重要的应用价值和理论意义。本文主要工作内容和研究成果如下:1.本文首先对传统图挖掘中的稠密子图挖掘进行了介绍,其中包括稠密子图的定义,稠密子图挖掘算法的研究背景现状等;接着介绍不确定图的研究背景及数学表达方式;最后介绍了基于不确定图的稠密子图定义及挖掘算法研究现状。2.利用目前的不确定图的稠密挖掘算法所发现的子图,存在着可靠度低、空间复杂度高、稠密度低等缺点。针对以上缺陷本文提出了β-子图及最佳β-子图的概念,并采用贪婪的思想提出了最佳β-子图挖掘算法,实验证明最佳β-子图较以往不确定稠密子图,在可靠性及稠密度都得到了显著提高。3.基于图论的关键词抽取算法在如今得到了广泛使用,但传统的无监督关键词抽取算法存在无法反应词汇语义信息、面对短文本时准确率低等缺点。本文结合word2vec提出了一种词间的文本局部相似度公式,并通过提出的顶点密度概念及候选关键词评价指标DEN,提出了基于不确定图的候选关键词抽取算法,并最终结合IDF提出了关键词评价的优化标准DEN-IDF。实验表明DEN-IDF较传统的关键词抽取算法,准确率得到了显著提升。
其他文献
中原油田毛8区块位于内蒙古自治区巴彦淖尔盟乌拉特后旗,气候条件恶劣,采出原油含水率高,乳化程度高,给该区块原油脱水带来了极大困难,因此通过研究该区块的稠油乳状液特性,
近年来,随着我国建筑行业的不断改革以及国家政策的不断推动,以装配式建造为主要生产方式的新型建筑模式悄然升起。相较于传统施工模式,它具有生产效率高、施工技术创新、节
以补铁剂为线索,设计了“检验补铁剂中铁元素的价态”“鉴定补铁剂溶液中是否含有Fe^3+”“探究Fe^2+与Fe^3+相互转化的条件”“防止补铁剂变质的措施”四大核心任务,适时渗
日语"人(ひと)"和汉语"人家"都有指称说话者的自称用法,并且二者都是通过"依存于对方的自我定位"来实现自称功能。但是,二者在使用语境和心理机制上存在不同。日语"人(ひと)"
动态流散性和堆积密度是炸药的重要特性,它们是晶体形状、粒子表面状态和特性的重要反映。在分步压装生产工艺过程中,弹药的流散性和堆积密度直接影响到装药的质量和炸药的发射
针对钝感无起爆药点火器射频感度高于装配敏感装药的桥带和半导体桥火工品设计感度的问题,从产品结构及装药两方面进行了分析和试验验证,找到了钝感无起爆药电火工品射频感度
随着不可再生资源的日益短缺,节能己成为科技发展的必然路线。超市冷冻冷藏系统也是耗能大户,因此研究其节能显得尤其重要。主要从超市的陈列柜本身和冷冻冷藏系统两个方面出
期刊
中国民族历史悠久,尽管称谓各异,但"民族"作为一个重要概念维系着数千年的历史叙事。近代以来,由于传统与现代、中国与西方的"民族"意义并不完全重合,现代民族国家建构与传统
论述了国内外火工药剂细化技术的研究概况 ,针对敏感起爆药的特殊性 ,借鉴其他领域超细材料制备方法 ,提出用微乳液合成法制备超细敏感起爆药。