【摘 要】
:
随着互联网的高速发展以及各种社交媒体软件的兴起,信息获取途径开始朝着多源化方向转变。随之而来的是网络环境中每时每刻都在产生规模庞大的数据信息,这些信息通常表现为文字、图片、视频、声音等多模态数据形式。多模态数据对相同事物的理解通常都会存在不同程度的互补性,通过对不同模态数据进行融合和统一表示,可以满足人们对多模态数据之间交叉检索的需求。因此,开展跨不同模态数据的检索方法研究具有重要的研究价值和广阔
论文部分内容阅读
随着互联网的高速发展以及各种社交媒体软件的兴起,信息获取途径开始朝着多源化方向转变。随之而来的是网络环境中每时每刻都在产生规模庞大的数据信息,这些信息通常表现为文字、图片、视频、声音等多模态数据形式。多模态数据对相同事物的理解通常都会存在不同程度的互补性,通过对不同模态数据进行融合和统一表示,可以满足人们对多模态数据之间交叉检索的需求。因此,开展跨不同模态数据的检索方法研究具有重要的研究价值和广阔的应用前景。跨模态检索研究主要是通过挖掘多模态数据间的语义信息建立语义关联,从而实现数据间更加精确的交叉信息检索。当前针对跨模态检索的研究主要面临三个问题:首先是不同模态数据的底层特征结构不一致,导致数据间存在异构鸿沟;其次是通过计算机提取的信息底层特征表示与人类对高层语义信息的认知也存在较大的差异,使得两者间存在明显的语义鸿沟;此外,现有的跨模态检索技术通常不可扩展到大规模数据集,这极大地限制了被检索的多模态数据的规模和多样性。针对跨模态检索方法的研究,如何从大规模多模态数据的异构特征学习同构公共表示,缩小跨模态数据之间的异构鸿沟,克服不同模态内的语义鸿沟的同时保证同构公共表示的语义相关性,对于实现跨模态数据的有效度量具有重要意义。本文以文本和图像模态作为研究对象,主要研究工作如下:(1)针对不同模态数据特征表示的异构分布和潜在语义信息挖掘不完全、不充分的问题,提出基于语义自编码学习的跨模态哈希检索方法。该方法利用不同模态的特征标签,深入挖掘标签中丰富的语义信息,指导不同模态内的底层数据结构和模态间的高层语义间的相关性建模,利用丰富的特征和语义标签信息缩小不同模态间的异构鸿沟,找到具有相似性度量的最优哈希码,然后使用线性自编码器学习哈希函数,使得在结构和维度上存在较大差异的不同模态的异构数据之间可以直接执行跨模态检索任务。(2)针对模态内的数据结构和模态间的结构匹配关联性不强和存储开销大的问题,提出基于矩阵分解和自编码学习的跨模态哈希检索方法,主要分为矩阵分解和自编码学习两个部分。第一部分,由于同一件事物会由表现形式完全不同的模态进行描述,即模态间的异构鸿沟,为了更加深入地挖掘和建立不同模态之间的语义关联,本算法利用矩阵分解学习各模态间潜在语义的一致性表示,构建其潜在因子模型。第二部分,结合矩阵分解,通过线性自编码学习哈希函数,以潜在语义表示矩阵作为约束,缩小模态间的异构鸿沟,充分挖掘不同模态间丰富的潜在语义关联信息。将本文提出的两种算法模型分别在WIKI、MIRFLICKR、NUS-WIDE三个基准数据集上实现交叉检索,实验结果充分证明,本文设计的算法模型与其它对比算法模型相比具有一定的优势。
其他文献
近年来,国家对建筑机电设备抗震日益重视,大大促进了我国在建筑机电抗震领域的发展。铝合金支吊架是一种新型支吊架,其连接形式和抗震性能还有待于进一步研究。本文总结了传统抗震支吊架的破坏形式及缺陷,提出一种新型铝合金抗震连接件。通过建立单侧向、双侧向抗震支吊架的简化力学模型并进行受力分析,设计出双管双立柱铝合金抗震支吊架,主要设计要求参照现行相关规范,节点设计满足承载力和稳定性的要求。采用有限元软件对铝
[目的]随着循证医学理念的推广应用,中医药临床试验数量快速增长,为促进相关研究证据的转化应用,对2019—2020年度研究情况进行总结和评估并提出合理建议。[方法]基于中医药循证评价证据库系统(EVDS),辅以文献数据库补充检索,获取2019—2020年度发表的中成药随机对照试验文献并进行统计分析。[结果]共纳入文献2 463篇,其中中文2 439篇,英文24篇,中文核心期刊收录149篇(6.11
随着社会的发展,全球能源短缺问题愈加严重,开发及利用可再生能源已成为全世界的首要任务。建筑能耗是全球碳排放的重要来源之一。在建筑节能减排领域,中深层地埋管换热器热泵供暖技术已逐渐成为我国双碳目标下北方清洁供暖可选方案之一,建立中深层地埋管换热器传热模型并掌握其地下、地上部分的传热性能是推广及应用这一技术的关键。目前国内外对这项技术的研究更多是针对地下埋管换热器的传热分析与实验研究,但对中深层地埋管
固液相变储能技术具有单位容积储热量大、温度波动范围小、体积变化量小、污染小以及热化学稳定性强等优点,在建筑节能、太阳能系统、电力系统和军事工业等领域得到了广泛应用。固液相变材料通过相态转化进行热量的储存和释放,其融化与凝固过程主要发生在固液共存的糊状区中,研究糊状区内颗粒相变中的运动特性和传热特性有利于掌握固液相变机理,优化相变储能技术。本文采用数值模拟的方法,专门研究糊状区内颗粒运动和融化的传热
随着对公共领域安防检测技术要求的日益提高,毫米波探测系统被广泛应用在安检的仪器设备上,相关仪器也被大规模地部署于火车站、飞机场、地铁站等公共交通场合。而毫米波探测系统又分为主动成像和被动成像两种,主动成像系统需要主动对目标场景发射毫米波能量,然后对反射的回波信息加以处理获得理想的成像效果;被动成像系统只需被动接收目标场景辐射出的毫米波能量就能实现成像。相较于主动成像方式,被动成像方式与可见光成像原
生物柴油具备良好的燃烧性能、优良的环保特性和可再生性等优点,被认为是化石能源的优质替代品。原料油成本高是制约我国生物柴油发展的主要因素。以低品质的餐饮废弃油脂为原料油生产生物柴油不仅可以极大降低成本,而且能够实现餐饮废油的资源化利用。酸性催化剂是实现餐饮废弃油脂高效转化为生物柴油的关键。固体酸具有催化活性高、环境友好和可重复使用等优点,但普通固体酸因孔隙结构不理想、活性位分布不均等问题,造成稳定性
近年来,我国对铁路运输的需求量越来越大,高铁作为铁路发展的标志性设施,对一个国家起着不可替代的作用,并因此得到迅速发展。然而,在高承载量与高使用频次下,高铁的无砟轨道板会因为受到连续冲压而出现不同程度的表面裂缝伤损,并降低轨道的负荷能力与平顺度,从而影响列车的安全运行。因此,进行高铁无砟轨道板的表面裂缝检测成为了保障高铁安全运营的重要工作。当前,在目标检测方面,深度学习方法具有检测精度高、识别效果
交通运输的快速发展获益于公路的高速建设,但随着运营时间的积累,公路路面会出现各种类型的病害,使得公路结构的强度和使用寿命受到影响,进而对公路交通运输带来较大的安全隐患。因此,快速、准确地识别公路路面病害,对公路路面病害的精准防治和保障交通出行的安全性、舒适性具有重要意义。传统的公路路面病害检测采用人工巡检的方式,这种方式易受主观因素的影响,并存在巡检周期长、效率低和反馈不及时等问题,且巡检人员的安
中成药大品种具有临床价值大、科学价值强、市场价值高的基本特征,中成药大品种不仅是中药产业发展的核心引擎,也是中医药学术发展的重要内容,事关中医药事业与产业,意义重大。本文以中医理论创新与中药大品种为切入,在回顾中医理论创新研究方法与模式的基础上,强调有效方药的创制是理论创新研究成果的集中体现,并以风咳理论与苏黄止咳胶囊、络病理论与通心络胶囊为例予以说明。提出以中成药大品种为载体,实现中医理论创新研
随着中国城市化率提高,供热管网规模快速增长,管网状况愈加复杂。泄漏作为供热管网的主要运行故障,产生的原因有很多,并且管网埋地较深,若泄漏的时间和位置不能快速确定,会造成较大的经济损失,影响人们正常生活。本文在总结分析以往供热管网泄漏诊断研究成果的基础上,提出基于变点理论经典方法——累积和(Cumulative Sum,CUSUM)方法和泄漏仿真模型的集中供热管网泄漏故障诊断方法,以期能够诊断出供热