播存环境中话题挖掘及其在个性化推荐中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:ADAM129XU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双结构新型网络以传统TCP/IP网络为主结构,添加以异步广播通信为基础的“播存环境”作为次结构,来缓解当前互联网面对的流量高度冗余、内容难以监管等问题。播存环境通过“统一内容标签”(UCL, Uniform Content Label)为用户提供交互性的主动信息服务。“话题”作为UCL的关键字段和重要概念,在播存环境强调的个性化推荐和内容聚类中,起着刻画网页内容特征和用户需求的重要作用。因此,研究符合播存环境特点与需求的话题挖掘算法,以便从采集到的热门网页资源中动态、高效地挖掘话题对播存环境具有重要意义。本文结合播存环境需求与特点,提出并实现一种播存环境在线话题挖掘算法BS-OLDA (Broadcast-Storage Online Latent Dirichlet Allocation),同时将BS-OLDA算法和话题信息应用于播存环境个性化推荐中,提出并实现了基于话题的个性化推荐算法BS-TR (Broadcast-Storage Topic-based Recommendation)。本文的主要研究工作如下:·为了解决播存环境中话题信息不易挖掘的问题,设计出一种播存环境在线话题挖掘算法:BS-OLDA。BS-OLDA利用UCL信息和贝叶斯方法改进传统话题挖掘算法,达到了对海量新闻网页动态、高效地进行话题挖掘,自动填充UCL话题字段的效果。同时,BS-OLDA通过新话题检测方法,检测网络中最新涌现的话题,从而更新话题映射表以动态反映网络中的话题变化。·针对播存环境中的个性化推荐需求,提出了一种基于话题的个性化推荐算法BS-TR。 BS-TR算法应用BS-OLDA提取网页内容的话题特征向量,并根据用户历史阅读行为,计算用户话题兴趣特征向量,在此基础上利用相对熵衡量相似度以进行个性化推荐。相比于传统的协同过滤算法和基于内容的推荐算法,BS-TR算法效率更高,并一定程度上缓解了冷启动问题,同时能更精确地刻画用户和网页的特征。·在面向播存环境的内容分发原型系统中,实现了BS-OLDA和BS-TR算法,利用BS-OLDA对原型系统采集的网页内容进行话题挖掘,并且利用BS-TR算法计算用户话题兴趣特征向量,进行基于话题的个性化推荐。实验与分析结果表明,本文提出的BS-OLDA算法和BS-TR算法,可有效提高播存环境下内容分发的效率,显著改善用户的使用体验。
其他文献
作为互联网的重要组成部分,校园BBS完善了信息化校园的新型校园形态,成为了师生在日常生活中自由获取信息和交流意见的平台。但是随着意见的扩散和逐步深入,各种观点发生交流
随着无线网络的普及,定位技术的重要性日益显现。室内定位作为定位技术的一个重要分支,具有很大的实用价值,如机场、展厅、博物馆、购物中心、仓库,地下停车场,超级市场等等都需要
学位
信息全球化要求各企业的应用软件之间能协同工作,进行数据或信息的实时交换,同时企业在系统开发中,通过集成不同供应商提供的软件取代由自己独立开发所需软件,可以明显缩短系统开
随着网络技术的飞速发展和下一代网络概念的提出,使得在异构网络平台上实现语音、数据、视频等多媒体业务互通成为可能。SIP(Session Initiation Protocol)协议就是由IETF(The
学位
聚类分析是将数据对象分成类或簇的过程,使同一个簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异。聚类分析源于许多研究领域,包括统计学、生物学和机器学习等。
学位
3G采用了开放式分层网络架构,其业务运营环境与2G/2.5G存在着很大的不同。2G/2.5G采用多点分散计费,各业务系统均提供计费功能,导致计费功能重复并且系统建设和维护的成本增
计算型云平台是一种以资源整合为主,利用虚拟化核心技术,通过一系列的云计算资源管理方案为用户提供各种需求的服务性平台。计算型云平台具有覆盖范围广、使用效率高以及依据用
随着Internet上信息量的大量增加,人们对信息的需求也越来越专业化,个性化服务技术的出现,可以在一定程度上解决Internet中信息多样化与用户需求专一化之间的予盾,将个性化服务技
学位
随着科学技术的发展以及计算机网络技术的普及,分布式数据库系统逐渐取代了集中式数据库系统,走进我们的生活中。然而伴随着分布式数据库系统的广泛应用,其所涉及的查询效率
在计算机图形学中,水波模拟是一个有意义并且具有挑战性的课题。要得到逼真的水波动画,关键的工作在于模拟水波的运动形态。本文的主要工作有:首先介绍了水波模拟的研究背景与意
学位