【摘 要】
:
信息时代下,网络数据获得爆发式增长,其带来更好的服务、更便捷的体验的同时,也带来了信息过载问题。就电影网站而言,电影数据资源的不断增多和观影人数的不断扩大,导致观影者无法在短时间内挑选到其喜爱的电影。如何能为用户精准推荐成了电影系统研究和设计的热点问题。本文即从此出发,提出了基于矩阵完备性的推荐算法来设计电影系统,并对这一设想进行了实现。具体研究内容如下:(1)设计算法来缓解协同过滤所存在的稀疏性
论文部分内容阅读
信息时代下,网络数据获得爆发式增长,其带来更好的服务、更便捷的体验的同时,也带来了信息过载问题。就电影网站而言,电影数据资源的不断增多和观影人数的不断扩大,导致观影者无法在短时间内挑选到其喜爱的电影。如何能为用户精准推荐成了电影系统研究和设计的热点问题。本文即从此出发,提出了基于矩阵完备性的推荐算法来设计电影系统,并对这一设想进行了实现。具体研究内容如下:(1)设计算法来缓解协同过滤所存在的稀疏性问题、可扩展性问题和相似度失真问题。其核心思想是根据评分矩阵的低秩性,运用基于矩阵完备性的SVT算法对评分矩阵进行填充;再通过Mini Batch Kmeans聚类方法对用户进行划分,构建用户与用户之间的近邻关系,以减少近邻构建时用户的搜索时间;最后用加入时间因子的相似度算法进行Top-N推荐。(2)针对系统的冷启动问题,一方面,利用新用户的注册信息,计算新用户的特征偏好,并作为推荐标准;另一方面,利用电影的类别、标签信息,计算电影相似度以得到推荐信息。(3)对电影推荐系统进行全面的需求分析,通过需求分析构建整体系统框架,并详细划分与设计各个功能模块。(4)根据各功能模块的设计,对各模块进行实现,并在系统实现后从功能和性能的角度对系统进行测试。由此,本文设计并实现了一个基于Django的电影推荐系统。经测试验证,该系统更好地解决了稀疏性、冷启动等多个问题,满足了系统功能和性能的多方需求。
其他文献
考试是选拔人才的主要途径,它要求绝对的公平公正,而替考这一考场舞弊行为严重的损害了考试的公平性。因此,如何提高考生身份识别的准确率,保证考试的公平性,具有重大的研究价值。目前的考场签到过程中,多数考场仍然采用人工比对身份证和准考证的方式来判别考生身份,这种方式存在人工开销大、判别出错几率较大的问题。基于此,本论文通过对生物识别技术中人脸识别算法的研究,设计了一套便携式考场签到设备及系统,结合人脸识
随着生活节奏的加快与社会压力的增大,人们因饮食不规律导致患胃肠道疾病的现象愈加严重。近年来,无线胶囊内镜技术已成为检查患者胃肠道的首要选择。然而,一次无线胶囊内镜检查将产生约6万张图像,带给医生后续筛查工作沉重的负担,如何快速有效地从海量图像中识别检测出病变已成为亟待解决的重要问题。神经网络在处理图像问题上有着得天独厚的优势,基于神经网络的医学影像分析为解决这一问题带来新的契机。无线胶囊内镜图像与
随着互联网逐步深入到人们的生活,网络安全问题也影响到社会生活的方方面面,其中以木马和僵尸网络所造成的危害最大。为了躲避网络边界的检测,这类恶意软件通常使用HTTP协议作为应用层协议,把自己的流量隐藏在大量HTTP背景流量当中。传统基于流量模式匹配的检测方法,在面对这类经过伪装的恶意流量时往往无能为力,研究者们开始转向使用机器学习的方法来实施恶意流量检测。而这些方法,往往针对单个HTTP请求数据流进
近年来,随着智能手机和平板电脑广泛普及,互联网社交媒体的用户数量迅速增长,与此同时产生了海量的社交媒体数据。在这样一个信息爆炸的大数据时代,如何挖掘出海量数据背后的价值成为了众多研究者的研究方向。相较于其他数据挖掘方法而言,机器学习无疑是当前应用最广泛且最成熟的。研究人员将社交媒体和机器学习相结合,在分析公众舆论,灾害治理,市场营销等方面已经取得很大的成效。然而不可否认的是,在机器学习技术给我们带
在现实世界中,图像数据包含现实对象的海量信息,是对客观对象的描述或客观的映射。为计算机能够更好的理解现实世界,发展出来多种计算机技术,基于深度学习的语义分割方法能够较好地提取图像高层语义信息,更好地应对自然场景。深度学习语义分割算法中的特征提取部分十分重要。模型越深特征提取能力就越强,但是所得到的特征越抽象。以Deeplab语义分割框架作为基础,提出优化方法,通过对比实验结果说明优化效果的有效性。
近年来随着深度学习技术的快速发展与卷积神经网络在计算机视觉研究工作中的广泛应用,图像分析与理解领域的研究工作取得了瞩目的成绩。作为图像分析与理解领域的重要分支,光学字符识别(Optical Character Recognition,OCR)技术和方法逐渐成熟,在生活中得到广泛应用,将OCR技术用于文档识别与场景文字识别的需求与日俱增,具有极大的使用价值和应用前景。票据作为人们生活中常接触到的一种
随着互联网的快速发展以及企业运维项目管理的要求越来越高,传统的开发部署模式存在许多不足之处。比如资源利用率低、难以迁移、强依赖于硬件、无法持续集成、部署困难、配置环境复杂等。这种传统开发模式已经不能满足用户以及企业需求,大量企业开始寻求新的开发部署模式。为了解决上述问题,本文设计并实现了一个持续集成与部署系统,采用一种新的运营管理模式来替代传统的部署模式。首先对系统进行需求分析,将系统分为五大功能
由于机器学习技术带来的产品功能与性能上的优势,在不同的行业背景下应用前景愈发广阔。在机器学习工程中,训练使用的数据质量极大影响了被训练模型的效果。为方便算法模型获取特征明显的训练数据,需要对原始数据进行标注处理以便于算法模型发现其中的模式与规律。汽车资讯标注系统是在此背景下为处理与汽车资讯相关图像、语音与文本数据,通过全人工标注或半自动标注方式,将汽车资讯原始数据转化为可供算法模型训练的数据集。根
红外成像系统,无论在民用还是军事领域都得到了广泛的应用。而要对红外成像系统,以及其上搭载的其他功能进行测试,往往需要使用红外仿真技术,其逼真度直接影响测试的可靠性。所以在三维场景仿真中常使用光线追踪作为渲染框架。路径追踪是光线追踪框架的一种实现方式,使用了蒙特卡洛方法,随机跟踪多条光线,随后根据这些光线的贡献计算该点的颜色值。利用蒙特卡洛方法的无偏性和一致性,生成照片级真实的图像。大多数成熟的渲染
论文针对大型构件高铁白车身腻子自动化打磨过程中,需要同时满足大尺度、高精度、稠密点云以及高效率的测量需求,在多目视觉线结构光大尺度高精度测量技术的基础上,提出基于辅助相机标定的多目视觉线结构光大尺度高精度测量方法,降低对标定工具的要求,简化标定流程,同时采用全局优化算法对测量系统整体优化,减小点云数据拼接误差,进一步提高测量系统的精度,实现高铁车身表面三维形貌的全局精确测量,为高铁白车身自动化生产