【摘 要】
:
视觉场景理解包括检测和识别物体、推理被检测物体之间的视觉关系以及使用语句描述图像区域.为了实现对场景图像更全面、更准确的理解,将物体检测、视觉关系检测和图像描述视为场景理解中3种不同语义层次的视觉任务,提出一种基于多层语义特征的图像理解模型,并将这3种不同语义层进行相互连接以共同解决场景理解任务.该模型通过一个信息传递图将物体、关系短语和图像描述的语义特征同时进行迭代和更新,更新后的语义特征被用于
【机 构】
:
哈尔滨工程大学智能科学与工程学院,哈尔滨150001
论文部分内容阅读
视觉场景理解包括检测和识别物体、推理被检测物体之间的视觉关系以及使用语句描述图像区域.为了实现对场景图像更全面、更准确的理解,将物体检测、视觉关系检测和图像描述视为场景理解中3种不同语义层次的视觉任务,提出一种基于多层语义特征的图像理解模型,并将这3种不同语义层进行相互连接以共同解决场景理解任务.该模型通过一个信息传递图将物体、关系短语和图像描述的语义特征同时进行迭代和更新,更新后的语义特征被用于分类物体和视觉关系、生成场景图和描述,并引入融合注意力机制以提升描述的准确性.在视觉基因组和COCO数据
其他文献
为解决粒子群优化算法中种群多样性与收敛性间的矛盾,提出一种具有重组学习和混合变异的动态多种群粒子群优化算法.该算法动态划分多种群并融入重构粒子作为引导因子,在增加种群多样性的同时保留优秀粒子的空间信息;在算法执行阶段对最优个体施加混合变异,基于时变概率实施反向学习策略或者邻域扰动操作,帮助粒子快速跳出局部困境,加强对附近区域内的精细搜索.基于14个多类型标准测试函数,并与其他的改进粒子群算法进行对比,验证了几种改进措施的有效性和叠加影响.为进一步探究概率性混合变异策略的敏感性,对变异方式及参数设置进行仿真
构建双渠道和线上到线下(O2O)两种模式下的供应链博弈模型,研究Showrooms效应影响下的供应链定价和渠道模式策略选择问题.研究结果表明:无论何种渠道模式,Showrooms效应和线下展厅服务使得制造商和零售商提高线上和线下渠道的零售价格;双渠道模式下制造商将降低批发价格,而O2O模式下制造商不一定降低批发价格.线下展厅服务和Showrooms效应可以增加线上、线下渠道和总需求量,实现零售商利润增加,零售商会提供线下展厅服务并愿意接受O2O模式.只有当Showrooms效应较小时,制造商选择O2O模式
我国建筑能耗约占社会总能耗的30%,其中集中式暖通空调系统能耗约占一半以上.为提高节能效率,本文提出基于负荷预测的空调冷冻站系统神经网络预测控制策略.本文采用神经网络作为优化反馈控制器,将满足负荷需求和系统能效比需求作为优化目标,将变分法和随机梯度下降法相结合,对神经网络权值进行滚动优化,既能解决传统变分法由开环控制引发的对随机干扰和不确定性敏感的问题,又可避免基于动态规划的非线性优化算法的“维数灾”问题.本文以北京某国企科研楼的空调系统为研究对象,实验结果表明,本文所提出的神经网络预测控制策略与PID控
针对自主水下航行器的路径跟踪控制问题,首先,将基于路径坐标系和虚拟向导概念建立的跟踪误差方程转换成一种新的级联系统表示形式,该级联系统由一个位置误差名义系统和与之级联的速度和航向误差子系统组成,与常规控制器求解相比,解耦了位置误差与速度和航向误差子系统;其次,利用滤波反步法对速度和航向子系统进行求解,避免了反步法对虚拟控制量解析求导引起的“计算膨胀”的不足,并通过构造辅助系统对滤波误差和输入受限下的控制量残差进行补偿,基于李雅普诺夫稳定性理论保证了速度和航向子系统的有界收敛;再次,通过级联系统理论证明闭环
在工业领域,数据缺失十分普遍,对解决下游任务(如软测量、异常检测)造成阻碍,这些任务大多依赖完整而高质量的数据集构造模型.现有缺失数据填补方法很少考虑数据填补后的具体下游任务(软测量).如何根据下游任务针对性地进行数据填补是当前研究中的挑战之一.为此,提出一种加入临时软测量模块的对抗生成数据填补模型(SSIGAN).与生成对抗数据填补模型(GAIN)相比, SSIGAN模型显式地考虑了软测量损失对
微波加热的内部传热方式及热点的随机分布特性导致采用常规测量方法难以获得温度的准确信息,在改进机械设计的研究中,螺旋辐射单模式搅拌器微波加热系统能够改善温度分布的均匀性.在单模式搅拌器的基础上,进一步探索具有多个模式搅拌器的微波加热系统的温度均匀性及其计算问题;同时,由于微波加热过程中多物理场的深度耦合及边界条件的时变特性,如何协同模式搅拌器的状态特征与有效计算温度场,开展温度均匀性的优化处理成为关注的重点.为此,应用一致性算法表达模式搅拌器的状态信息,对温度场分布的均匀性进行优化计算.一方面通过一致性算法
针对经典的直方图均衡化图像增强算法可能存在的对比度过度增强、亮度分布不均匀和细节信息不突出等问题,提出自适应直觉模糊相异直方图裁剪的图像增强算法.基于直觉模糊集的"投票模型",引入直觉模糊相异直方图的概念,并基于此提取图像像素的空间位置信息.同时,利用S型隶属度函数对图像直觉模糊相异直方图进行自适应裁剪,采用分段策略对裁剪后的直觉模糊相异直方图进行均衡化处理.最后,利用直觉模糊集的犹豫度刻画原图像
为提高算法求解动态多目标问题的寻优性能,提出一种多种群分解预测动态多目标算法.首先,提出进化向量生成策略,即基于偏好目标的解生成一组均匀分布的平行向量,并采用引力搜索算法优化每个子问题,保证其对应解的精度和分布的均匀性;其次,设计插值生成策略,即根据进化向量子问题的解在目标空间中的取值,通过线性插值的方式生成更多非支配解,保证解集的多样性和均匀性;再次,在环境变化后,根据相邻子问题的解存在相近性预测生成搜索种群,提高算法的寻优速度.与5个对比算法在10个标准动态测试函数上进行对比分析,实验结果表明采用所提
对大规模路网交通流进行准确预测,能够应用于区域交通协同控制与管理,提高路网运行效率.针对如何高精度地拟合大规模路网交通流时空分布并对其进行准确预测,提出基于梯度惩罚的Wasserstein生成对抗网络(Wasserstein generative adversarial network with gradient penalty,WGAN-GP)的大规模路网交通流预测算法.根据大规模路网交通流数据特点,为了增加模型对时间相关性和远距离空间相关性特征的抽象能力,采用残差U型网络作为生成器来增加网络深度;采用