基于认知记忆激活的语义表示方法及其应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhuzihai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义表示与分析是人工智能领域的基础研究问题。随着互联网数据的爆炸式增长,如何实现高效准确的语义表示,进而从大规模数据中挖掘有价值的语义信息并加以利用,具有十分重要的研究价值。然而,面对日益复杂的海量动态数据计算需求,新的研究挑战也在不断涌现。例如在文本表示领域,由于社交媒体平台的用户生成文本具有语义模糊、新词、非规范表述等特性,如何更有效地挖掘和表示文本的隐含语义内容?在网络表示学习领域,如何将大规模网络中包含的抽象语义信息高效地表示出来?  由于人脑在知识表示与语义分析方面的天然优势,借鉴认知心理学中人脑的记忆激活机制完成语义表示与分析成为一个重要的研究思路。然而目前已有的方法大多需要借助专家经验或已有知识,无法适应大规模、动态化的互联网计算环境。基于以上现状,本论文有针对性地探索了如何更有效地将记忆激活理论应用于语义表示工作,并服务于现实应用。具体来说,本论文将认知心理学中的ACT(Adaptive Control of Thought)记忆激活理论体系引入文本和网络的自动语义表示工作中,分别探索了ACT理论体系中的关联激活理论和扩散激活理论在文本和网络语义表示中的应用价值,提出了相应的文本增强表示方法和网络表示学习方法。并进一步将所提出的方法联合建模,应用于模因爆发预测的实际任务当中。  本论文的主要研究内容与贡献包括:  1)将ACT关联激活理论应用于文本表示,提出了基于关联激活的文本增强表示方法AADE(Associate Activation-Driven Enrichment)。从信息论“熵”的角度,论证了利用现有信息激活隐含语义概念的关键因素,并通过这些因素与ACT关联激活理论中激活长期记忆所需要素的一致性,论证ACT关联激活理论在文本隐含语义表示和分析中的应用原理与价值。在此基础上,提出基于关联激活的文本增强表示方法AADE,包括一个总体框架以及三个具体的AADE模型。通过在长、短文本,中、英文数据集上进行的文本极性分析、主题建模、文本检索、分类、聚类等一系列基础性文本分析实验,证明了AADE方法能够在线性时间内显著提升多个文本分析任务的效果。对比当前的主流文本表示方法,AADE能够有效挖掘文本中的隐含语义信息并进行显式化表示,兼具有效性、可解释性、高效性与兼容性。  2)将ACT扩散激活理论应用于网络表示学习,提出了基于扩散激活的网络表示学习方法Spread-gram。首先论证了ACT扩散激活公式用于网络表示学习的可行性,同时提出Spread-gram模型的目标函数。然后根据ACT扩散激活理论中的节点传播模式实现网络的扩散激活式节点搜索与向量更新策略。在此基础上,根据网络的不同类型,分别提出针对同质网络和异质网络的Spread-gram模型。在同质网络和异质网络上完成的节点分布可视化、节点分类、链接预测等一系列实验表明,Spread-gram训练获得的网络节点向量能够有效地表示网络中的语义信息,在多个任务中取得显著效果提升,且仅需很少的迭代次数便可以使模型达到收敛。对比已有方法,Spread-gram实现了网络的全局输入,避免了随机游走等方法可能带来的局部输入和输入偏差问题,同时具有模型快速收敛的特性。  3)探索了AADE和Spread-gram方法在信息传播领域的联合应用,提出了模因爆发实时预测方法SNT(Semantic,Network and Time)。该方法以信息传播单元—“模因”作为研究对象,通过观察模因产生初期的传播情况,预测其未来是否会呈现爆发式传播。SNT整合了模因传播过程中的文本语义特征、网络空间特征和时序特征,并对这三个领域特征进行联合建模,实现模因爆发的实时预测。在模因传播的公开数据集以及真实采集数据集上,通过真实场景的实验模拟以及典型案例分析,论证了SNT预测的“实时”、“高精确度”特性。相比已有方法,SNT充分利用了模因传播过程中的语义与时空信息,在对不同类型的模因进行实时爆发预测任务时都能取得较好的效果,且预测有效性不依赖于监测时间,这对于信息传播分析和早期预警具有十分重要的意义。
其他文献
在当前世界石油生产中,特别是油田开发后期,有杆泵抽油方式占有很大比重。油田生产往往是在野外进行,地理位置分散,自然环境恶劣,井下工况复杂,造成抽油机的故障诊断不及时和
磁悬浮技术是一门新兴的机电一体化技术,由于其具有无摩擦、无磨损、无需润滑、寿命长、低功耗、无噪声等优点,引起了世界各国科学界的特别关注。本次课题研究的GML磁悬浮实
电热油炉被广泛地应用在工业生产中,它的温度控制效果直接影响到生产效率和产品质量,因此对温度控制系统的要求很高。目前工业电热炉通常采用常规PID控制,但电热油炉是一个具
机器人技术是备受当今世界关注的热点课题,对机器人的研究内容涉及机械学、电子学、计算机科学、控制工程学、生物学、人类学、人工智能与社会学等。并且其近年来取得了巨大
复杂网络是研究复杂系统的一门新兴学科,近几年受到国内外研究学者的广泛关注。任何复杂系统都可以抽象成为由相互作用的个体组成的网络。研究复杂网络的最终目标是理解网络上
现场总线的出现彻底改变了传统的工业仪表控制系统的结构,并使其向一个网络化、智能化、分散化的方向发展。现场总线控制系统以现场总线为纽带,把单个分散的测量控制设备变成
钕铁硼材料是一种高端稀土材料,按照生产工艺可将其分为烧结钕铁硼和粘接钕铁硼两类。其中,烧结钕铁硼由于具有优异的磁性能而被广泛应用。成型-烧结工序是烧结钕铁硼生产流
近年来,心血管疾病患者逐年增加,发病率日益升高。以导管为核心手术器械的微创介入手术具有创伤小、恢复快等优点,在世界范围内被广泛用于心血管疾病的治疗。传统心血管介入
随着我国经济的飞速发展,城市化的进程也在不断加快,各种高层建筑不断的出现在我们的生活中。如何在发生火灾时,将高层建筑中的人员成功疏散出火灾现场已成为公共安全领域研
图像特征检测与匹配是计算机视觉中的一个关键问题,在物体识别、三维重建、图像配准、视频理解等诸多领域具有非常重要的应用。尽管近些年来对该问题的研究取得了一些突破性进
学位