论文部分内容阅读
近几年,随着互联网经济的蓬勃发展,在线视频流量急剧增长,视频用户群体也在飞速扩大。与此同时,在线视频广告收入也急剧增长,使得视频广告在网络视频市场中存在着巨大的潜在商机,吸引了越来越多为媒体开发新的广告模式的研究。视频中的同款服装逐渐成为人们广泛关注和追逐的热点。为了让视频广告与视频内容密切相关,减轻对视频用户的干扰,提高广告推广效率,我们需要研究更为有效的广告投放方式,同时借助明星带来的流量效应。为了将视频网站和电子商务两大互联网平台相结合,将用户流量转化为商品销量,本文提出了一种基于明星识别的服装时尚数据挖掘方法。该方法旨在识别出视频中特定人物的服装,例如主角,同时得到服装的类别以及该人物在视频中所穿服装的件数。本课题主要包括两部分:(1)视频中特定人物的服装检测,包括人体区域检测、姿势判别、人脸检测与身份验证、服装检测;(2)对识别出的服装图像进行聚类,将因视频帧的连续性而检测出来的同款相似服装图像归为一类,以聚类中心作为该件服装的代表,去除冗余的相似数据。本文首先对目标检测领域、图像特征提取、图像相似性判断以及聚类算法的国内外发展现状进行了总结,同时对比分析了不同的目标检测模型。然后对检测出的服装图像,使用基于三元组损失函数的深度模型提取图像特征,该方法直接通过端到端学习获得从图像到一个紧凑欧式空间的映射,其在特征空间中的距离直接用于表征服装之间的相似性。最后,在学习到的特征空间里,对经典的密度聚类算法做出改进,提出了一个适用于本场景的、且不需要指定聚类个数的聚类算法。通过在真实视频数据集上进行实验,结果表明了本文所提方法的可行性和优越性。