网络新闻图像中人脸标注技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a6863156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术、计算机技术的迅速发展,多媒体数据已经成为重要的信息资源,人们每天都可以通过互联网接触到大量的多媒体信息,如视频、图像、各类新闻等。网络新闻作为一种多媒体数据大都与公众人物的行为活动相关,公众人物的行为活动又与当前的重要事件密切关联。因此,如果能够方便地对新闻图像中的公众人物进行检索,那么便可以快速了解各种事件的动态。面对大量的新闻图像资源,如果人工寻找某个相关人物的图像,是对人力与时间的浪费。如果能对新闻图像中的人物标注,并生成相关数据库,则可以很方便、快速地对人物进行检索。采取手工标注的方法是有效的,但是多媒体和网络技术的迅速发展使得图像库越来越大,完全使用手工标注,工作量太大。网络新闻中图像与文本相互关联,本文利用网络新闻这种图文并茂、图文互补的特性,生成有人名标注的人脸图像数据库。在网络上获取大量新闻数据,从新闻数据的文本部分提取出与新闻相关的人物的名字,并在与文本相对应的新闻图像中进行人脸检测得到人脸图像,最终得到大量的带有噪声的人脸人名对。通过学习可以去除噪声,得到正确的人脸人名映射关系,即将网络新闻图像中出现的人用其名字进行自动标注。这样就将图像检索问题转化为文本检索问题从而可以很好地解决人物检索这一问题。本文采用基于Adaboost的人脸检测算法从新闻图像中获取大量的人脸图像,通过中值滤波、直方图均衡化来提高人脸图像质量,通过人眼定位来校正并标准化人脸图像,得到一个标准化的人脸图像集合。针对网络新闻图文互补的特性,本文对AP聚类算法进行改进,提出了基于改进AP聚类的人脸图像标注方法,最终得到人脸与人名之间的对应关系。并且提出通过一个合并聚类的过程识别出同一个人的不同名字。改进的AP聚类算法能充分利用网络新闻图文互补的特性,将来源于网络的新闻数据进行处理,最终得到一个带有准确人名标注的人脸图像数据库,同时支持基于内容的人物检索与基于文本的人物检索。
其他文献
仓储物流业是国际海运物流中的关键环节,随着我国物流业的逐步发展,仓储物流的发展也越来越迅速,货物存储量越来越大,对仓储物流业的准时性和及时性提出了更高的要求。作为服务行
随着计算机网络的不断发展,人类科技发展也朝着全球信息化的方向不断迈进。与此同时,网络中的各种安全事件的频繁发生也严重威胁了互联网的安全。在众多网络技术研究和应对网
由于互联网的复杂性、异构性等问题严重制约互联网行为的研究,网络模拟就成为了研究Internet的重要手段。网络拓扑数据作为网络模拟的基础数据,其真实性直接影响模拟的真实性
近年来,在多维关联规则中,主要是研究关联规则的正规则问题。对于多维负关联规则的研究相对较少。这种情况存在下,多维负关联规则的挖掘算法就显得尤为重要。虽然已经奠定了
公钥密码的出现促使了数字签名技术的产生,数字签名技术在现代盛行的网络电子交易中发挥着不可替代的重要作用。以RSA公钥密码为基础的数字签名技术在网络身份认证中扮演着重
随着互联网的高速发展,网络技术得到不断提高,攻击手段和攻击方法变得更为复杂,各种类型的攻击事件层出不穷。现有的安全措施无法保障网络系统的安全、可靠与正常的运行。为
碰撞检测问题在计算机图形学、机器人路径规划、虚拟装配、计算机动画等领域有很长的研究历史。目前,已经成为虚拟现实技术研究的一个热点。虚拟环境的真实性和沉浸性,不仅需
移动传感器网络是由小微型、低功耗传感器节点组成的,能够感知和处理被监测范围的数据信息,通过节点的无线通信功能上传采集到的数据信息。其网络中的传感节点都具有移动性,能够
基于CT图像的CAD(计算机辅助诊断)技术是目前世界上一种先进的医学影像诊断检查的临床应用技术,该技术通过对计算机图像处理技术来高效识别CT图像中的可疑病灶。CAD技术能够提高
随着人民生活水平的提高,“健康”和“疾病”成为人民关注的焦点,运用计算机技术进行疾病分析预测也成为健康医疗领域的研究热点之一。呼吸系统疾病是一类常见疾病,而且和气