基于深度学习的视图检索研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:suanjava
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新媒体信息爆炸式增长,如何有效地检索识别出敏感内容,满足执法机构保障互联网舆情的需求,是科研工作者的重要课题。经过对敏感数据的分析研究,逐渐形成了以深度学习视图检索为核心的检索架构。本文课题的研究基于中电某所“互联网内容监管平台LCBIR”项目。课题要求将视频图像等数据抽取、压缩、编码并构建出索引数据库,对多媒体平台推送的信息数据进行检索识别和分析判断,能够有效地甄别出海量信息中的敏感内容,为平台相关子系统提供重要分析线索。本文重点研究如何利用基于内容的图像检索(Content Based Image Retrieval,CBIR)技术快速检索出敏感内容数据。在CBIR技术中,图像特征提取方案与索引检索算法直接决定了系统检索性能。首先,针对传统特征提取算法过程繁琐、内容表示能力不足、优化潜力有限等缺陷,本文对基于深度学习的图像特征提取方法进行分析研究,并结合局部聚合描述符向量与难采样三元组损失函数,给出了一种改良后的残差网络,增强了所提取特征的局部不变性与表达能力,同时提出了一种利用改良残差网络的图像特征提取方案。其次,通过对大规模索引检索的需求与检索策略进行分析研究,为满足大数据处理、高特征维度、适配索引数据库、响应迅速的特点,结合近似最近邻搜索策略,本文提出了一种基于倒排索引改良的乘积量化算法并实现。通过划分特征维度空间,改良算法以非线性方式遍历索引库的指定范围,以此减少多余的计算过程,达到了索引数据动态增删的目的,有效避免了在实际应用中因重建索引库而产生的高昂运维成本。最后,对上述工作进行模块性能测试与系统测试。模块测试结果显示:(1)改良后的乘积量化索引检索算法在召回率、耗时与索引大小上均优于MLSH、PQ、HNSW算法;(2)利用改良残差网络对图像特征提取,对比现有的图像特征提取方案,在CBIR的四大性能指标上均有显著性提高。系统测试结果显示:本文给出的CBIR满足了敏感视图检索系统的各种功能需求,达到了对敏感内容的高效识别。
其他文献
模型驱动的软件开发方式(Model-Driven Development,MDD)目前被广泛应用于面向服务架构的信息系统中,而模型转换作为MDD中的重要环节和核心技术,它的正确性直接影响了基于MDD
统计数据显示:约四分之三的游客在出游前都会去登录主流旅游网站查看用户评论(评分),以确定更好的旅游目的地,同时制定出游路线。旅游景点推荐的研究已取得一定进展,但仍存在数据稀疏、未考虑用户隐性偏好、未深入挖掘景点图像的潜在语义等问题。提出采用分层抽样统计模型获取用户偏好,改进贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)及视觉贝叶斯个性化排序(Visual
在超大规模集成电路(Very Large Scale Integration,以下简称VLSI)物理设计中,布局问题将模块放置在一个给定的区域内,在满足模块间不互相重叠的基础上,优化一些相关指标(如
利用语音障碍进行帕金森病检测是目前帕金森病早期诊断的研究热点之一。近年来基于深度学习的语音障碍检测发展迅速,且检测正确率高。由于深度学习固有的特点,使得通过深度学习网络自动学习的语音特征在医学上可解释性较差。针对这一问题该文提出研究帕金森病语音传统特征梅尔频率倒谱系数和语音深度学习特征间的关系。主要使用偏最小二乘法、多任务Lasso(Least absolute shrinkage and sel
超密异构网络(heterogeneous ultra dense network,H-UDN)是在传统的宏基站覆盖范围内密集地部署一层小基站实现无缝覆盖,通过缩短用户与基站之间的距离来提升用户的速率,拥有着处理海量(1000倍)无线数据流量的能力,被认为是实现5G及未来网络的关键技术。然而,随着小基站数量飞速增加,小基站与宏基站之间的回程负担急剧加重,致使回程传输成为了H-UDN性能提升的瓶颈。无
多能体系统的分布式协同控制中每个智能体都能与相邻的智能体进行通信,使得多智能体系统的整体效率和运行能力都有所提高。由于其广泛的实际应用以及低成本、高自适应、易于维护等优点,引起了众多研究者的关注。已有文献大都考虑一阶、二阶或高阶线性动力学的多智能体系统,然而实际物理系统具有复杂的非线性特性,因此研究高阶非线性多智能体系统的一致问题具有重要意义。随着研究的深入和实际需要,对多智能体的性能也提出了新的
柔性集成电路基板(Flexible Integrated Circuit Substrate,FICS),简称柔性基板,是一种未封装电子器件的电路板裸板,是电子设备的核心组件之一,其质量检测极其重要。随着电子
作为传统多输入多输出(multiple-input multiple-output,MIMO)技术的一种扩展,在基站(base station,BS)端配置成百上千根天线的大规模MIMO能有效提高系统容量。为了受益于大规模MIMO技术带来的优势,需要获取准确的信道统计信息(statistical channel state information,S-CSI)。由于天线尺寸变大及散射体生灭过程,大
风力机叶片大多数为玻璃纤维环氧树脂复合材料(Glass Fiber Reinforced Plastic,简称GFRP),是风力机获取风能的关键部件。在叶片的生产过程中,往往因为其制作工艺的特殊,自动
行为检测旨在通过智能算法自动地定位视频中感兴趣行为,并判断行为的类别。行为检测是计算机视觉研究领域一项极其重要且困难的研究任务,其研究成果可被广泛应用于智能监控系