基于用户信誉评级的UGC质量预判方法

来源 :郑州大学 | 被引量 : 0次 | 上传用户:kang573
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代的到来改变了原有的信息生产方式,信息来源由经专业编辑审核后的书籍、报纸、电视节目等,转变为可由任意个体或群体创作、恣意传播的内容。UGC(User-Generated Content)的激增在丰富网络信息资源的同时,其质量参差不齐,影响互联网络的健康发展。如何对低质量UGC进行及时有效地评估与甄别、对高质量UGC进行高效地组织和管理,影响着网络信息环境的生存与发展。目前,已有关于UGC质量评价与控制的研究多是从信息内容角度出发,忽略了用户行为因素。本研究从用户信息行为角度出发,通过对用户历史行为与UGC质量关系的挖掘,建立用户信誉评分机制,进而建立基于用户信誉评级的UGC质量预判模型,实现对用户未来产出UGC质量的有效预判。研究共分为六个章节,第一章、第二章主要是对UGC研究背景和相关理论的阐释;第三章、第四章主要是对影响UGC质量的用户信息行为因素的分析和基于用户信誉评级的UGC质量预判模型的构建,通过挖掘与分析用户过往信息活动中所产生的创建行为、转发行为和评论行为等历史信息行为,进而为用户建立起个人信息行为信誉评级模型;第五章、第六章主要是对模型有效性的验证及对未来研究的展望,通过爬虫抓取和用户提交相结合的方法获取六位用户一年间使用微博的行为数据,并以一自然周为一个评测周期,共测得53个时间点下的用户信息行为数据,进而计算出用户信誉得分。同时为降低评价过程的主观性,设计UGC信息质量评估系统,辅助评估用户历史行为信息质量。实验结果表明,该模型不同于以往依赖单一文本分析对UGC质量评估的方法,其结合信息学和行为学方法,具备较高的预测准确度。由于对用户信誉等级的评分尚没有统一的评判标准,致使研究中存在一定程度上的主观性。同时,根据用户过往行为记录叠加起来的用户信誉,只能对用户未来行为向好或向坏的趋势做出一定的预判。因此,未来的研究可在建立统一用户信誉评判标准的基础上,更深层次地挖掘影响UGC质量的用户信息行为,结合语义分析方法和情感分析方法,进一步提高UGC质量预判的准确度。本研究获得国家社会科学基金项目资助,项目编号15BTQ064。
其他文献
近年来,一系列畜产品安全事件频繁发生。如“三鹿奶粉"事件、红心鸭蛋、瘦肉精等事件,暴露出我国畜产品安全监管体系存在问题。畜产品安全卫生不仅关系到畜牧业生产和畜牧产品安
满足病人的需求是护理工作的根本目标,更是护理可持续发展的基础,伴随着人们生活水平的不断提高,患者的需求从内容和形式上都出现了多样化的局面。特别是乳腺癌患者,不仅要经
<正>把握机遇,有三个层次,即“抓住机遇,珍惜机遇,用好机遇。”机遇就在事物的发展过程中。在推进国有企业改革创建现代化企业制度的过程中,存在这样一个问题:就是企业发展的机遇来
阅读教学是中职语文教学过程中的难点和重点,如何有效提升学生的阅读能力始终是困扰一线教师的问题。本文通过中职语文阅读教学中存在问题的分析,认识到解决这一问题的关键在
随着图书馆事业的发展,图书馆用户权利与义务的协调与平衡越来越受到图书馆界的重视和关注。目前,图书馆界对图书馆用户权利进行了相对充分的研究,而对图书馆用户义务的研究
在数字阅读不断推进的背景下,高校图书馆作为大学生文化教育的中心,理应发挥好自己应有的效用,做好数字阅读推广的服务工作,新兴媒体的出现开始成为图书馆进行数字阅读推广的
针对目前我国铁路列车运行图在编制与管理中的特点,分析存在的问题,结合我国列车运行图编制管理机制和现有技术水平,提出强化完善现有管理体系和加强信息系统建设的对策措施,
针对传统调度集中系统存在的诸多问题,铁道部制定了发展新一代调度集中系统的战略部署。为此应明确新一代调度集中系统的技术要求,制定完善的技术规范和作业标准,同时注重国
随着社会进步和发展,冲突理论在很多领域被引用,图书馆领域也受到冲突理论的影响。图书馆馆员和读者在图书馆服务工作中的关系本来就是不可分割相互依存的,但是在现实中读者
本论文首先对国内外关于物流、不确定性和资源优化配置三方面的论文进行理论综述,并对其进行了研究评述;进而指出了前人研究中相对薄弱的环节,作为本论文的研究领域,即为第三