社会媒体中的用户偏好建模研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zmz28859330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web 2.0的发展,人们已经习惯在网上发表自己的观点及看法,也从别人发布的信息中获取自己所需的信息,从而形成了一个由广大用户主导的互联网模式。在这样的互联网模式下,人们越来越依赖网络,从最初的查找资料,到后来的各种聊天社区,到现在衣食住行等都要到网上看别人的评价才会做出决定,互联网正在改变人们生活的方方面面。而社会媒体正是这些行为的媒介,包括虚拟社区和网络平台等,人们可以在上面创作、分享、交流意见、观点及经验,主要包括微博、博客、论坛、网络社区、评论网站等。人们在社会媒体上发表自己的观点,而个人观点一般是带有情感偏好的,这些观点大致分为2类,一类是文本信息,比如微博的内容等,另一类是打分信息,比如电影的评分等。用户偏好是指用户对于某件事件、物品的喜爱、厌恶等各种情感。用户偏好研究就是通过研究这些蕴含了丰富情感的信息,了解用户想表达的情感偏好。本文将从方面评分的评分预测和唐代诗词的情感分析两个方面来研究社会媒体中的用户偏好问题。方面评分是产品各个细致方面的评分,而总评分是产品所有方面的综合评分。现今,大部分使用总评分的工作都是基于这样一个假设:总评分是方面评分的平均分或总评分与方面评分很接近。然而经过分析真实数据集发现,在总评分和方面评分之间存在一个评分偏差,但现有工作并没有考虑评分偏差。本文首次研究了带有评分偏差的方面评分预测问题,提出了一个新的情感主题混合模型RCMB。RCMB认为总评分是概率图的中心并通过一个隐藏方面评分变量整合了评分偏差先验信息。在真实数据集(大众点评和TripAdvisor)上的实验表明,RCMB比其他现有方法取得了更高的预测准确率,并更能保持评分的相对顺序。现有的情感分析工作一般是关注现代文本,比如产品评论和微博,很少涉及古代文学作品的分析。而诗词则相当于古代人所使用的微博,也是表达其情感的重要媒介。本文提出了一个基于迁移学习的中国唐代诗歌情感分类模型TL-PCO,通过分析诗歌的情感可以了解到当时的社会和文化进展。TL-PCO通过两个迁移学习函数得到两种特征,再加上古代诗歌本身的特征,建立3个分类器并投票得出最后的结果。在中国唐诗上的实验表明了方法的有效性,并详细分析了唐代各个时期以及重要流派的情感,结合社会历史的分析,取得了良好的效果。
其他文献
款词是侗族民间文学样式之一。款词内容丰富,“百科全书”式记述侗族历史、社会生活、风俗和宗教信仰等文化事象。论文倚重田野个案,运用民俗学、人类学等学科理论和方法,对
为揭示黏虫被病原菌侵染后的免疫应答机制,本试验分析比较了黏虫幼虫被金龟子绿僵菌Metarhizium anisopliae侵染后不同时间其血淋巴蛋白含量、免疫关键酶系(酚氧化酶PO,溶菌
目的:讨论分析脑钠肽(BNP)、尿酸、乳酸脱氢酶(LDH)心肌钙蛋白T、总胆红素、间接胆红素检测指标在心血管疾病中的临床应用。方法:收集2016年2~7月期间心血管疾病住院患者(心
【正】 举凡名茶大多是用一个芽或一叶初展为原料,以细嫩、清香而出名。西园茶则恰与之相反,它以粗壮、烟香而脍灸人口,实乃名茶谱中所特有的一员。特在何处?产地特殊——当
【正】 从武宁县城驱车南行十公里,但见万山丛中,山岗之上,排排青砖红瓦的机房,被浓浓的绿色包围。放眼山坡,茶丛迤逦,层层叠翠,青波绿浪,生机盎然。这里便是被誉为"茶甲中华
为药用昆虫金边地鳖的深入开发利用提供参考,采用荧光染色法与气相色谱-质谱(GC-MS)法相结合,探究金边地鳖血淋巴的活性成分及其对SGC-7901胃癌细胞活力的抑制作用。结果表明
单片机与PC 机并行方式较为少见,其主要适应于短距离数据传输,且对于串口数据校验有着严格要求,数据传输过程也具备较多优点,可以得到令人满意的效果。以计算机Windows 系统
目的观察中医宏观辨证结合胃镜下微观辨证治疗反流性食管炎(肝胃不和证)的临床疗效。方法将80例患者按随机数字表法分为两组,两组均给予埃索美拉唑镁肠溶片、枸橼酸莫沙必利
协作学习是现代远程教育的一种重要教学组织形式。搞好网络环境下协作学习,对于改变教学模式和学习方式,培养学生的自主学习能力、创新能力、研究性学习能力和团体协作精神,
改革实践教学模式,提高学生的实践能力是当今高校教学改革的重点之一。项目驱动下的实践导师制(PTSBPD)是一种新的学生实践能力的培养模式,它的形成是知识动员在教育领域的有效