【摘 要】
:
近年来,由于深度学习的出现,人工智能在各个领域的飞速发展是有目共睹的。自然语言理解作为人工智能领域的热点研究方向之一也随之崛起。目前,市场上的对话设备层出不穷,但是对话系统在解决仪器设备的使用问题中的应用并不多。由于仪器设备的操作越来越复杂,不久的将来基于图像的对话帮助系统的研究会是一个不错的研究方向。相比纸质的帮助方式,图像结合对话的帮助方式能够更方便、更快速的解决用户使用设备时遇到的难题。本论
论文部分内容阅读
近年来,由于深度学习的出现,人工智能在各个领域的飞速发展是有目共睹的。自然语言理解作为人工智能领域的热点研究方向之一也随之崛起。目前,市场上的对话设备层出不穷,但是对话系统在解决仪器设备的使用问题中的应用并不多。由于仪器设备的操作越来越复杂,不久的将来基于图像的对话帮助系统的研究会是一个不错的研究方向。相比纸质的帮助方式,图像结合对话的帮助方式能够更方便、更快速的解决用户使用设备时遇到的难题。本论文主要是针对仪器设备的使用帮助的研究。提出了面向设备的深度学习图像对话帮助系统模型,并实现了该模型的原型系统,最终将该模型应用在了仪器仪表领域。首先,分析了面向设备的深度学习对话帮助系统模型相关领域的发展历程和国内外研究现状,并对模型需要用到的实例分割算法、分词工具、多模态融合以及概念从属树等理论基础进行简单介绍。其次,结合对话实例分析了关于仪器设备对话帮助系统中语言理解的诸多难点,并总结分析得出目前多模态视觉对话准确率不高的原因之一是因为自然语言模态往往结合图像进行了省略,由于省略导致的歧义造成模型在没有正确理解自然语言文本语义的情况下与图像模态的信息进行对齐融合。针对这种情况,本文所提出的面向设备的深度学习图像对话帮助系统模型在传统的多模态信息对齐融合之前先进行基于图像与知识结合的省略恢复消歧模块处理,利用“示波器才能测波形”这类知识解决了一系列省略歧义问题。歧义处理之后,模态之间能够建立联系的信息相比未处理时更加完善。从而,帮助系统就能更加精准的确定用户提问的仪器设备实例主体。然后,在BERT语言模型以及LXMERT多模态模型的基础上建立了面向设备的深度学习图像对话帮助系统预训练模型。模型预训练之前,首先建立了模型相关数据集,并针对数据集中图片与问题一对多关系提出相关解决方案。接着,结合双模态输入实例分析了模型中主要模块的处理思路及训练结果,重点剖析了基于图像与知识的省略恢复模块的恢复过程。最后,将面向设备的深度学习图像对话帮助原型系统应用在仪器仪表领域,以获取具体仪器设备信息为例,详细介绍了仪器仪表领域知识库的建立过程,并将获取到的数据以仪器设备概念从属树的形式组织管理并存到数据库。然后以语音为主,界面为辅的方式展示了模型在仪器仪表领域中的应用方式。
其他文献
二氧化钛(TiO2)是一种非常重要的宽禁带(~3.0-3.2 e V)半导体材料,由于其经济无毒且具有物理化学性质稳定的特点,而被广泛应用于紫外探测、光催化和环境能源再生及保护等各个领域。但由于TiO2对可见光吸收有限且其性能受形貌及晶型影响较大,严重阻碍了TiO2在各领域的应用。近年来,为提高TiO2对整个太阳光波段的光谱吸收,科研工作者主要采用以下三种方式提高其性能,(1)控制形貌:低维纳米线
Al Ga N/Ga N异质结具有很强的自发和压电极化效应,即使在没有任何掺杂情况下,只有极化应力也能在Al Ga N/Ga N异质结界面的量子阱中产生高密度的二维电子气体。Al Ga N/Ga N HEMT在高频电子器件和高功率中具有很大应用潜力。然而,在高功率器件应用中,Al Ga N/Ga N HEMT的结温持续升高成为制约其进一步发展的瓶颈。传统衬底上的Al Ga N/Ga N HEMT具
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种成像分辨率高、全天时、全天候、作用距离远的微波成像系统,凭借其诸多优点合成孔径雷达在军用和民用领域发挥着巨大作用。在追求合成孔径雷达技术应用能力不断提高的大环境下,合成孔径雷达工作模式目前已经发展出条带模式、聚束模式、滑动聚束模式、扫描模式、循序扫描地形观测等工作模式。滑动聚束模式既解决了条带模式下方位向分辨率受限问题,
高维数据集引起的“维数灾难”问题不仅增加了计算内存和运行时间,而且会导致学习器分类性能的下降。而特征选择技术通过排除冗余和不相关的特征来减少数据维度,从而提高学习算法的性能。但在特征选择中,寻找最优特征子集是一个NP难问题,使用传统的贪婪式搜索方法极易陷入局部最优。而群智能算法中的蚁群优化算法因其出色的全局和局部搜索能力和灵活的图形表示方式而广泛应用于特征选择。但是当前基于蚁群算法的特征选择方法主
随着科学技术的不断发展,软件已服务于生活中的各个方面,同时其数量与种类仍在不断增多。但其实大多数企业采用的软件开发方式因工作的重复度过高,具有开发效率慢的缺点。因此在软件开发领域出现了一种基于软件资产进行软件开发的方式,即软件重用。软件重用的实施必须具备两个基本条件,分别是存在大量的可重用软件资产供开发人员挑选以及存在一个可重用软件资产库管理系统来管理可重用软件资产。但现有系统因具有缺少资产安全性
随着国内集成电路行业的飞速发展,芯片复杂度的不断提高,如何确保所研处理器的正确性成为了芯片研发流程中的一个重要内容。指令集模拟器(ISS)作为芯片设计、验证、应用等阶段中不可或缺的重要工具,可以通过建立目标处理器的功能模型,来模拟每条指令在目标处理器上的执行结果。对于复杂度更高的人工智能(AI)芯片,开发一款仿真速度快、模拟精度高的指令集模拟器,更是有助于加速芯片架构探索和设计,对缩短芯片研发周期
随着计算机技术的不断进步,基于深度学习的人工智能技术高速发展,已经被广泛应用在交通场景下。尤其在智能交通系统和自动驾驶场景中,通过使用目标检测算法对采集到的视频进行检测,不仅可以获取车辆、行人的基本信息,还可获取相应的流量信息,并预测其运动趋势。除此之外,我们还需对周围环境做出准确感知,因此通过图像分割技术来从道路图像中获取周围环境信息,从而区分行人、车辆、障碍物、车道线和可行驶区域等重要交通信息
初中历史学业水平考试(以下简称中考)作为义务教育阶段历史学科的总结性考试,也是高中教育选拔的重要依据,关注初高中衔接,反拨初中历史课程改革是中考的重要功能。《中国高考评价体系》提出"四层"考查内容以学科素养为导向,推动核心素养在高中教育中的落实,助推素质教育的发展。基于学段特征做好初高中衔接,引导初中阶段课程教学和评价从知识本位向素养本位的转变就成为当前中考改革的重要方向。近两年广东省中考历
光电成像技术是现如今信息获取和情报收集的重要手段,然而难以同时兼顾大视场与高分辨率成像的缺点制约了光电成像系统在新领域的应用。多尺度成像技术的提出在一定程度上解决了上述难题,但是仍存在其固有的缺陷:中心与边缘成像分辨率不一致,这个缺陷随系统视场增大而愈发严重。针对多尺度成像技术的缺陷,本文从多尺度成像原理与传统光学系统设计的角度出发,采用分视场分区域多焦距光学系统设计的方式,根据全视场内不同视场角
复杂环境下的多目标跟踪问题给雷达系统带来了巨大的挑战。目前主流的多目标跟踪方法都基于贝叶斯滤波理论框架。其中,基于随机有限集(Random Finite Set,RFS)的高斯混合概率假设密度(Gaussian Mixture Probability Hypothesis Density,GM-PHD)滤波算法在杂波环境中表现出良好的跟踪性能,对比传统基于数据关联的多目标跟踪算法,具有无数据关联、