基于随机点积图理论的模式识别方法研究

被引量 : 7次 | 上传用户:vvf021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术与人工智能理论的发展,模式识别的理论与方法研究已经取得很大进展,并已广泛应用于声音和语言识别、文字识别、指纹识别、图像分析等领域。近年来,网络数据的分析和处理成为模式识别的重要研究内容。面对网络这种新型、动态的大规模关系数据,随机图及其所衍生出的复杂网络理论受到越来越多的关注。研究表明,随机图可以更好地模拟现实的关系数据,在分类、聚类、匹配等模式识别经典问题中都显示出明显优势与发展潜力。本文立足于一种重要的随机图模型——随机点积图,重点研究了随机点积图在自动图像标注、多社团属性关系传播、网络攻击检测等多个模式识别新兴热点问题中的应用,并从理论上对随机点积图在保持模长归一化的约束下进行了进一步的推广。随机点积图是近年来新提出的一种点-边随机图模型,它通过对节点的随机赋值,依照点积规则计算节点之间的连接概率,从而通过节点的随机性体现出边的随机性,形成随机图。随机点积图具有聚类性、传递性、度幂律性等多种重要性质,可以很好地拟合现实存在的各种图结构和网络。本文从概率期望的角度证明了随机点积图的传递性,将在一维空间中的证明过程推广到高维空间中;传统的传递性质只涉及节点连通时的情况,本文提出了在随机点积图中节点不连通时边概率的传递性,并给予证明。对于随机点积图的求解问题,本文研究了随机点积图对关联图的模拟,并给出求解方法。该解法从关联图的加权邻接矩阵出发,将关联图的随机点积化问题转化成了矩阵范数逼近问题,通过对加权邻接矩阵的谱分解得到节点的赋值。图像标注是基于内容的图像检索的重要和具有挑战性的课题。随着数字图像数据量呈爆炸性增长,如何有效检索海量的图像数据是个人与商业搜索引擎都迫切需要考虑的问题。自动图像标注能提供更符合人类检索习惯的文本输入查询方式,是图像检索中的一项关键技术。本文提出了一种基于随机点积图的图像标注算法,该算法首先构造了一个融合了底层特征间、标注词间以及图像与标注词间的相似关系的关联图,再利用随机点积图对该关联图进行重构,挖据出图像的底层特征间和标注词间隐藏的相似关系,并形成状态转移概率,结合重启式随机游走,最终实现自动图像标注。基于随机点积图的图像标注算法将基本标注阶段与标注改善阶段结合起来,从整体进行关联图的随机点积重构,并实现自动标注。在多个通用图像库上的实验证明,该方法可以有效提高图像标注精度,尤其在图像库较小时,具有明显优势。近年来社会网络的研究取得了高速发展,其应用也越来越普及。与传统的模式识别不同,网络分析侧重个体之间相互联系的分析和挖掘,所以从模式识别的角度来看,网络分析也称为“链接识别”(Link recognition)或者“链接分析”(Link analysis)。在网络中,个体与个体之间围绕共同的兴趣和话题相互联系形成不同的社团。当前,社团已经成为了解网络结构、功能和增长机制的重要工具。由于不同社团中存在的数据关系大不相同,社团之间属性关系的传播已成模式识别中一个挑战性的问题。本文提出了一种基于随机点积图的多社团属性关系传播算法。该方法从已知属性关系的社团入手,结合目标社团中的个体特征,用随机点积图对当前属性关系不断演化,挖掘出目标社团中隐藏的属性关系。该方法可以同时实现对社团中成员的划分与属性关系的跨社团传递。通过在多个实际社会网络数据库的实验表明,该方法可以准确揭示社团中隐藏的属性关系。数据降维与嵌入是模式识别中的重要研究问题。对于关系数据,随机点积图可以将图中的节点嵌入到向量空间中。关系数据经过核函数形成的相似矩阵往往具有相同的对角元,基于这一重要性质,本文提出一种改进的随机点积图模型——保持模长归一化的随机点积图,它可以将图嵌入到一个球面空间中。此外,对于归一化的特征数据,现有的降维方法都没有考虑数据的归一化性质,将保持模长归一化的随机点积图模型用于这类数据的降维中,则降维后的特征数据依然是模长归一化的。在这种随机点积图模型的解空间中,欧氏距离与夹角余弦是等价的。本文从理论上给出了该模型的求解方法与收敛性分析。在多个真实数据库上的聚类实验表明,该模型可以得到更具可分性的节点嵌入结果。随着互联网技术的发展,大规模的动态网络通过计算机和其他设备将人类连接起来,这种大规模网络已经成为人们获取信息和知识的重要来源。为增强网络用户的安全性,网络攻击行为检测成为模式识别在网络分析中亟待解决的新问题。本文提出了一种新的基于保持模长归一化随机点积图的网络攻击检测方法,根据待测网络拓扑结构的随机点积图谱空间坐标识别欺骗或攻击。本文从理论上证明了攻击者与普通节点分别落在谱空间的不同区域中。保持模长归一化随机点积图将节点的谱坐标合理分布于球面空间中,并在该球面空间中识别攻击行为,尤其可以探测出在原始网络拓扑结构中难以识别的协同攻击。与现有基于拓扑的攻击检测方法相比较,对于各种形式的协同攻击,本文方法可以显著提高攻击检测的有效性及效率。
其他文献
以石墨烯、4-(2-吡啶偶氮)-间二苯酚和氯钯酸为前驱体,通过电化学沉积法制备了钯/4-(2-吡啶偶氮)-间二苯酚/石墨烯复合电极,并利用循环伏安法在硫酸溶液中对该电极进行表征。
中央7号文件是在学生体质20年持续下降的背景下提出的,中央7号文件是当前及今后一段时期开展学校体育工作极其重要的纲领性文件,对学校体育工作有促进作用,巴中市属于四川省
目的:通过实验研究观察血脂康胶囊对于db/db小鼠糖脂代谢、胰岛素分泌及胰岛素敏感性的影响,并探讨其可能的机制,以期在临床上更好的发挥中医药改善糖脂代谢紊乱的多靶点作用
目的:本研究通过收集病例,回顾性调查分析老年人继发性慢性肾脏病中医证型,探讨不同原发病所致老年继发性慢性肾脏病的证候特点和规律,以及证型与‘肾功能的关系,为老年继发性
战略性新兴产业是引导未来经济社会发展的重要引擎。发展战略性新兴产业已成为世界主要国家抢占新一轮经济和科技发展制高点的共同选择。自2009年国务院提出发展战略性新兴产
简要地介绍了Web应用中的MVC设计模式以及当前流行的Struts体系结构,结合实例介绍了Struts的实现方法,体现了MVC设计模式在Web应用中的高效率与可扩展性。
在我国现行的教育体制下,学业成绩仍然是衡量学生学习能力的重要指标。学习是人类进步和发展的重要途径,也是一个人终生都面临的重要任务。高中生的最终结业成绩关系着学生的命
风力发电是近年来世界各国普遍关注的新能源开发项目之一,发展速度非常快。风电技术也逐渐由陆地延伸到海上,海上风力发电已经成为世界新能源发展的亮点。海上风力发电设备的
本研究采用问卷法对黑龙江省佳木斯市某高中高一和高二880名学生进行调查,探讨高中生学习的自我监控与父母教养方式的特点及其与学业成绩的关系。本研究的主要结论如下:1.不同
研究目的:本研究观察原发性肝癌患者体质分布情况及手术前后中医证候变化,初步揭示肝癌患者中医体质分布、手术前后的中医证候变化特点及体质与证候之间相关性,为中医肝癌体质的