论文部分内容阅读
互联网时至今日已经有几十年的发展历史了,互联网上的信息也有原来的单纯的文本信息发展到文本、声音、图片和视频组成的多媒体时代。多媒体信息占互联网的全部信息的比重也越来越高,然而基于文本检索的方法只能检索到互联网上很少的信息,同时随着互联网井喷式发展,用户通过检索获取自己感兴趣的信息也越来越困难。本论文针对图像信息难以被有效地检索和海量数据难以被用户获取,提出基于图像语义的推荐研究。本论文研究内容分为两个部分,第一,如何有效的获取图像特征进一步获取图像的语义信息;第二,获取图像语义信息后如何将相应的信息有效地推荐给感兴趣的用户。在获取图像特征部分中,通过总结卷积神经网络发展趋势:1.卷积核小型化和模型深度化。2.增加模型宽度通过并行不同尺寸的卷积核尽可能的获取图像的特征和减少模型参数的复杂性。在Inception-ResNet-v2模型的基础上通过优化模型结构,从而提高获取图像特征的能力。在图像语义获取部分,总结循环神经网络的发展特点:模型内部分工细化和各个子单元模型相互交互。在长短期记忆模型的基础上修改其输入门、输出门、遗忘门和更新门的模型结构,从而提高获取图像语义的性能。在图像推荐部分,针对依赖用户数据推荐算法都要面对的冷启动、还有新图像无法被协同过滤推荐和相同图像去重机制这三个问题,提出改进措施:第一,针对冷启动问题本论文提出新热内容混合推荐的方式解决冷启动的问题,同时提出一套评价算法用于平衡新热内容。第二,针对无用户行为的新图像无法被协同过滤推荐的问题本论文采用基于内容推荐和协同过滤推荐相叠加的方式来解决问题,同时再引入环境因素,根据用户所在的位置、时间和天气信息推荐不同的内容,从而更好的提升推荐的效果和用户体验。第三,针对相同图像去重机制问题,本论文提出了图像热度加时间双因素的算法来保留得分最高的图像。最后,在实验部分分为两个实验,第一个评价获取图像语义实验,使用Microsoft COCO数据集以及它提供的评价标准来验证修改后的模型在性能上和之前的相比有所提升。第二个实验推荐效果使用查准率、召回率、F-measure、ROC曲线和AUC面积5种性能指标对改进后的算法进行评估,通过和之前单独使用协同过滤算法相比在性能上有较大的提升。