用于人群计数的混合注意力感知网络

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lishine369
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人群计数领域,基于卷积神经网络的深度特征取得了卓越的计数性能,几乎所有最新的人群计数算法都采用基于密度图的回归方法实现人群计数,它保留了人群的空间分布信息,直观地提供了不同区域的人群密度状况。在真实的人群场景中,如果想准确计数,需要解决大量的挑战,包括视角效应导致的尺度变化、不均匀的人群分布和场景各目标间复杂的关系。然而,已有方法要么无法有效地提取多尺度人群特征,要么仅依靠一阶注意力机制(例如二维的基于位置导向的注意力),而完全忽略了拥挤场景中的高阶统计信息。
  为了解决以上问题,本文首先提出了一个编码网络,它通过空洞卷积,在不增加额外计算量的前提下,显著扩大了网络感受野,在更大的上下文中提取深度人群特征。接着引入了解码网络,它使用了与编码网络密集的连接,同时使用了分布式监督,以更好处理尺度变化问题。在编码和解码阶段,本文分别引入了不同的注意力,即高阶注意力模块和自适应补偿损失函数。一方面,高阶注意力模块以核函数的方式,捕捉关于场景目标的更高阶关系,最终产生了一种三维注意力图,它关注重点区域,筛选有用信息,提取人群中每个人周围的有判别性特征。另一方面,在分布式监督框架下,自适应补偿损失函数利用了来自更高层的先验知识,以指导较低层的密度图预测,自适应地对不同区域加以关注。因此,这些组件建立起一个用于人群计数的混合注意力感知网络。在三个具有挑战性的基准数据集上的大量实验结果展示了,本文提出的混合注意力感知网络,取得了当前最佳的性能。
其他文献
夜是静的,静中发出的声响会给人留下格外深刻的记忆,如同听一首老歌,伴随着那熟悉的旋律,当年的景象也会出现在眼前。   记得几年前有一则电视广告,为一款黑芝麻糊做的,是电视广告中的不俗之作。黑芝麻糊在哪座城市叫卖并不重要,这种叫卖声是否准确也不重要,关键是广告体现了夜间叫卖的情景,和城镇夜生活形成一种和谐状态,让人一看就丝丝暖意油然而生。长夜不寐,偶闻叫卖声,无论是在山城石板街头来一碗“炒米糖开水
期刊
随着人们对无线通信传输速度和质量的要求越来越高,如何有效提高无线通信系统的频谱效率成为了学术界和工业界共同关注的焦点问题。多用户MIMO(Multiuser-MIMO, MU-MIMO)是当前无线通信提高频谱效率的关键技术,其在单用户MIMO的基础上利用空分复用大幅度提高了系统的频谱效率,目前MU-MIMO技术已应用到诸如WiFi、LTE等多类无线通信系统之中。制约MU-MIMO空间复用传输的一个核心因素是信道矩阵的条件数,而以波束切换的智能天线具有改善信道条件数的潜力,因此,MU-MIMO系统结合智能天
随着物联网的蓬勃发展和进步,智能城市已经成为一种新兴的范式,它是由无处不在的感知异构网络基础设施和智能信息处理、控制系统组成。于此同时,低成本的无人机正快速走向民用,在国民经济和国家安全的许多领域发挥着巨大的作用。为满足智慧城市中客户对包裹较短交货时间的需求,常使用车辆和无人机协同(车-机协同)来缩短配送时间。然而,车机协作工作模式却对安全通信、实时控制、优化调度算法设计等方面带来了新的挑战。
  传统方法研究的车机协作系统无人机类型只有一种,交付车辆也只是单一的送货卡车,这种合作交付系统在智慧城市
随着虚拟现实(Virtual Reality,VR)的广泛应用,如何提高移动用户终端VR业务体验已经成为当前无线通信的研究热点,VR无线化给无线通信系统的传输带宽和传输时延提出了极大的挑战。在当今主流的无线系统中,5G系统由于具有高带宽、低时延的优势,使得5G上传输VR业务成为现实;但另外一方面,面向室内覆盖(VR主要应用场景)的WiFi系统虽然在传输速率方面得到大幅度提高,但在传输时延方面还没有得到大幅度改善,因此,如何提高WiFi系统的VR业务质量具有十分重要意义和实用价值。本文依托实验室与国内某知名
随着移动设备的日益增多和智慧家庭的逐渐普及,用户对Wi-Fi的覆盖、速率及时延等要求越来越高,Wi-Fi高密集覆盖将变得越来越普遍。目前,由于接入点(Access Point,AP)之间缺乏有效的协作机制,Wi-Fi间干扰冲突将随着覆盖密度增加变得日趋严重,用户将陷入即使Wi-Fi信号强度很强但是连接速率低的困境,从而造成无线资源的浪费,因此AP间进行有效的协作将是密集Wi-Fi发展的必然趋势。现有大多数研究关注在基于信道分配的AP协作,考虑到正交信道数目有限,该协作方式在密集WLAN中不再适用;802.
在资金规模方面的巨大差距,使得民营银行可能在传统业务方面难以占得便宜,只有在与平台商业模式结合的地方才能够获得一定的优势。  近期,苏南银行、华瑞银行、苏宁银行、锡商银行、中联银行等多家以“银行”命名的民营企业,陆续通过了国家工商总局名称预核准。与此同时,20多家上市公司或其大股东蜂拥涉“银”,也在A股市场上掀起一波民营银行概念热,吸引资金竞相角逐,相关概念股近一个月来累计涨幅超过30%。  今年
期刊
随着IEEE802.11标准的发展,多个用户同时连接使用一个WiFi网络的场景随处可见。面向有线网络的TCP协议,在WiFi多用户环境下性能表现不佳,如何提高WiFi多用户场景下TCP业务的服务质量,具有非常重要的研究意义。
  本文首先针对WiFi多用户TCP业务QoS优化的问题进行分析,分析得出WiFi环境下的边缘用户MAC层确认易丢失导致下行数据不必要的重传,浪费大量空口信道资源,边缘用户自身TCP业务QoS会因此下降。本文利用IEEE802.11标准MAC层块确认机制和TCP协议可靠传输机制
对视频中的动作进行定位是理解视频内容的一个重要手段,然而,视频中的动作往往有着丰富的语义内容和复杂的背景知识,使得这些动作并不能完全被归纳到一个预定义的动作集中。为了解决这个问题,基于自然语言的视频段定位(Query-based Moment Retrieval in Videos,QMRV)被提出,QMRV主要研究的是:给定一段自然语言描述作为检索语句,我们要从一段未剪辑的长视频中定位出与该描述相对应的视频片段,即确定该视频段的起止点。作为一个新出现的领域,QMRV任务由于其在视频理解和人机交互方面的广
人群密度计数(Crowd Counting)的目的对监控场景中的人群进行数量的预测,同时生成人群密度图来反应当前场景中的人群分布。作为人群管理的第一个也是最重要的部分,自动人群计数可以监视区域的人群密度,并在密度超过指定阈值时提醒管理员进行安全控制。由于近年来世界人口的指数增长导致城市中心化,集体活动愈发频繁,在如此大的人口聚集与流动下,人群计数与分析就显得尤为重要。跟其他计算机视觉的任务一样,人群密度计数面临着诸多的挑战,包括:密集人群相互的严重遮挡,复杂背景的干扰,人群不均匀的分布,场景内与场景外的外
2012年9月27日,建行福建省分行与省经贸委、省企联签署《福建省小微企业助保金贷款业务合作协议》,在全国率先开展与省级政府层面合作的小微企业助保金贷款。省财政出资2000万元设立“助保贷”政府风险补偿资金,合作建立小微企业贷款风险池。  在省政府“助保贷”业务平台的带动之下,建阳、政和、古田、南平、福清、宁德、石狮、尤溪、三明、莆田城厢区等10个地市(县)政府也纷纷与当地建行分支行开展“助保贷”
期刊