微博用户兴趣的提取和动态建模

来源 :太原理工大学 | 被引量 : 2次 | 上传用户:ilovemn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体应用的迅猛发展改变了人们的生活和人际交往形式,以原创性、时效性、便捷性著称的微博表现出非常强劲的发展势头。微博的出现极大地丰富了网络中的内容,用户根据自身喜好关注微博平台中特定的公共或私人微博账号,来获取大量与用户兴趣相关的内容。微博系统为用户提供了丰富的话题及内容,用户可以根据自身的喜好来选择接收某些方面的内容,因此微博系统除在线社交功能之外的强大的功能是以兴趣为主导的内容接收或发布平台,在此基础之上,为了提高用户体验质量、分析用户行为轨迹、高质量的个性化推荐,用户的兴趣提取和行为动态建模十分必要。本论文的工作主要分为两个部分:第一个部分,通过分析微博消息的文本内容,挖掘用户感兴趣的话题形成用户兴趣,为用户的行为建模做准备;第二个部分,通过研究用户发布的与兴趣相关的微博,在时间轴上对用户的行为进行动态建模,挖掘用户行为规律,并且依据模型预测用户行为并对用户推荐相关内容。在挖掘微博用户兴趣方面,由于用户兴趣具有强烈的个人属性,本文主要采用非监督式学习的方法进行挖掘。首先将微博文本看作短文本,在此基础上实现对微博短文本的分词以及向量化;其次,对词语向量之间的相似度进行研究,利用相似度来表征微博文本之间的距离关系,为下一步工作做准备;再次,分别采用LDA主题生成模型和基于词向量的K-means聚类对用户兴趣进行挖掘;最后基于以上研究过程,生成基于用户微博短文本集的兴趣标签。在基于用户兴趣的用户建模过程中,首先选定与用户兴趣相关的微博短文本,按照时间顺序将用户兴趣排序,继而在时间轴上基于马尔科夫模型对用户的兴趣转移进行动态建模,生成用户兴趣转移概率矩阵,模拟出用户注意力在兴趣之间的转移情况,利用模型对微博用户进行内容推荐与内容预测,并利用内容推荐准确率对动态模型进行评估,实验结果表明本模型可以有效模拟用户行为,内容推荐准确率达到78%。
其他文献
本文比较全面地论述了某公司的人力资源管理问题,针对相应的问题提出了解决的对策。
目的比较经肩关节前内侧与肩关节外侧入路治疗肱骨近端骨折脱位的临床效果。方法将九江市第六人民医院186例肱骨近端骨折并肩关节脱位患者均分为试验组和对照组(n=93)。试验组
长三角区域一体化发展上升为国家战略,为业已存在的浙江安徽经济联系与合作带来了进一步拓展的崭新机遇。在区域一体化发展格局中,浙皖两省各扬所长、互补合作,构筑数字经济、旅
报纸
目的了解建材放射性分类标准及部分省市建材放射性水平,以引起人们对居住环境放射性的重视。方法将现行建筑材料国家分类标准与过往标准进行比较,并对部分省市的建筑装饰材料
目的分析与探讨沙美特罗联合布地奈德对于哮喘的治疗效果。方法选取2009年5月~2011年5月期间收治的70例哮喘患者为研究对象,随机将其分为观察组和对照组,每组各35例。观察组患者
目的探讨足癣患者口服β胡萝卜素软胶囊分别加中药地肤苦参粉溶液与复方土槿皮酊外用的临床疗效。方法将206例足癣患者随机均分成观察组与对照组(n=103),观察组采用口服β胡
<正> 疾病发生发展的一个基本环节就是病因通过其对机体的损害性作用而使体内自稳调节的某一方面发生紊乱,而自稳调节的任何一个方面的紊乱,就会使相应的机能或代谢活动发生
长久以来,我国中小型企业一直面临着融资难、融资贵的问题。国有银行等金融机构严格的风险控制,民间融资的不规范以及企业自身规模小、信用体系不完善等都是制约中小企业融资
为实现磁悬浮电机的稳定悬浮运行,研究一种基于最优控制理论的控制器设计策略。在分析磁悬浮电机结构和工作原理的基础上,建立悬浮转子的运动方程,构建以气隙偏移量和控制电
Turbo码于1993年由法国学者C.Berrou等人提出,其接近Shannon极限的优异性能引起国内外学者的关注,被看作是信道编码理论发展史上一个里程碑。随着理论基础的日益完善,Turbo码