论文部分内容阅读
网络普及带动了新闻产业的变革,网络新闻成为公众获取实时资讯的重要方式之一。可是面对海量的网络新闻,公众往往很难快速定位自己感兴趣的新闻。基于此,新闻事件发现技术应运而生,它能够从互联网中挖掘出热点话题,帮助用户了解当前热点;个性化推荐技术可以根据用户的行为习惯,挖掘其兴趣点,从而向用户推荐其可能感兴趣的新闻。当前,事件发现技术及个性化推荐技术在信息领域均获得普遍应用,但是,事件发现技术挖掘出的热点话题并不一定是每一个用户都感兴趣的;个性化推荐技术只能完成单一新闻的推荐功能,并不能把用户感兴趣的事件推荐给用户。基于此,本文提出一种个性化新闻事件推荐方法,将新闻事件发现技术与个性化推荐技术融为一体,该方法能够挖掘出新闻事件,并为用户进行个性化推荐。本次课题研究的主要工作列述如下:(1)实现一种基于融合模型的改进层次聚类算法。在计算新闻间相似度时,该算法基于TF-IDF的VSM模型与基于LDA主题模型按一定比例加权求和的方式进行相似度计算;在计算簇间距离时,该算法引入簇中心距离与簇间新闻最远距离,使得这一算法在计算簇间距离时更加准确。实证研究结果显示,本文所提算法与传统层次聚类算法相比,显著提升了准确率。(2)实现一种基于混合推荐的新闻事件推荐算法。该算法采用两种方式建立用户的兴趣模型,其一根据事件的多重特征以及用户的行为习惯构建目标用户的兴趣模型,其二根据用户浏览的新闻标题建立用户基于LDA主题模型的兴趣模型;然后,基于VSM模型与LDA主题模型按一定比例加权求和的方式计算不同用户间的相似度,得到目标用户的邻居用户集合,以集合中用户的共同偏好,来挖掘目标用户的兴趣点,最后,向目标用户推荐其可能感兴趣的新闻事件。通过本文的实验证明,该算法具有较高的准确率和召回率。(3)依据现实需求,本文开发出个性化新闻事件推荐系统。实证研究表明,本系统基本可以实现新闻事件发现以及新闻事件推荐的预设功能目标,运行稳定、高效。