【摘 要】
:
随着信息技术的发展和智能设备的普及,数字图像,文本,音频,语音等多模态的异构数据已经成为信息的主要形式,正在改变着人们的生活和工作方式。异构图是连接多模态数据之间关
论文部分内容阅读
随着信息技术的发展和智能设备的普及,数字图像,文本,音频,语音等多模态的异构数据已经成为信息的主要形式,正在改变着人们的生活和工作方式。异构图是连接多模态数据之间关系的重要表示形式,如何挖掘、分析异构图之间的关联,已经成了跨媒体和数据挖掘领域重要的研究方向。本文以异构图数据为研究对象,针对推荐系统,跨域链接预测和图文匹配等异构关系挖掘问题开展了深入的研究,论文取得的主要成果包括:1.针对推荐问题,在用户-物品异构图上,本文提出了一种基于图嵌入的矩阵分解模型(Graph Embedding based Matrix Factorization Model,GEMFM)。GEMFM通过联合优化自编码器模型和矩阵分解模型,使用自编码器中的非线性隐藏层来优化原始矩阵分解模型中的线性隐藏层表示,提高了模型的非线性表达能力。实验结果验证了 GEMFM算法的有效性;2.为解决跨域链接预测问题,本文提出了一种多阶段的跨域链接预测模型(Multi-Stage Cross-Domain Link Prediction Model,MCLPM)。在召回模型中,基于时序的统计特性,利用快速近邻搜索方法进行子集筛选,生成候选子集。在此基础上,在匹配模型中,提出了一种基于主动学习的采样方法,通过学习“难”样例,生成更鲁棒的决策面。实验结果证明了该算法针对跨域链接预测问题的有效性;3.对于图文匹配问题,利用图像和文本的异构关系,本文提出了一种深度图文匹配模型(Deep Image-Document Matching Model,DIDM)。利用卷积神经网络和词向量分别生成图像和文本表示。在此基础上,为建立图像表示和文本表示在同构语义空间中的精确匹配,引入三元组损失,从而实现跨媒体图文匹配。在大规模数据集上验证了 DIDM模型的有效性。
其他文献
高架桥建设初期仅考虑其作为汽车通行基础设施的功能,桥下空间缺乏对市民活动的考虑,造成城市活力网络的断裂和空间资源的浪费。以重庆市主城区的三处高架桥为引,通过实地调
目的探讨乳腺癌保乳加前哨淋巴结活检术患者的护理。方法将2015年9月~2017年9月在我院外科行乳腺癌保乳加前哨淋巴结活检术的76例患者随机分为两组,对照组采用常规护理方法,
随着社会经济的发展,能源短缺成为亟待解决的问题,甲烷水合物(可燃冰)是一种分布广泛、储量丰富且高效清洁的未来新能源。在实验室内研宄其物理、化学特性对将来合理地进行开采和
随着Google公司于2012年发布Google Knowledge Graph,国内外开始对知识图谱的研究升温,相关研究不断地涌现。这其中,通用知识图谱的构建和应用得到了长足的发展,WordNet、DBp
早上去洗杯子的时候,见到朱姐正在茶水间洗工衣。我问她,怎么不在家洗呀?这儿怎么晾呢?她不好意思地笑了笑,说,出租屋太小了,用水也不方便,就抽空在这儿洗了。我记得闲聊的时候曾打听
目的:建立散结灵胶囊中非法添加松香酸的HPLC与UPLC-MS/MS检测方法。方法:采用Shiseido Capcell Pak C18色谱柱(250 mm×4. 6 mm,5μm),流动相为0. 1%甲酸-乙腈-四氢呋喃(40∶40
目的通过检测企业职工的尿砷和血铅含量及对超标者进行临床观察、治疗,了解工作环境中砷、铅对职工身体健康状况的影响。方法采集某冶炼厂一线作业工人的169份尿液和血液,用
"超越法律"的企业社会责任,是企业负担的那些超出法律强制性义务规定且符合社会价值和期望的责任,确认这种责任的法律规范实为"软法",它主要通过责任目标内化于企业的商业行
本文从拉康镜像理论的角度探讨美籍华裔女性莉迪亚的离散身份建方式,论证大小他者是如何相互影响,构建起以异质、混杂、流动为核心特征的离散身份。
目的探讨马斯洛需要层次论在截肢术患者护理中的应用效果。方法将62例截肢术患者随机分成实验组和对照组各31例,对照组采用常规护理,实验组应用马斯洛需要层次论对患者实施护