微博用户行为分析技术的研究与实现

被引量 : 0次 | 上传用户:ivanc1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博,是微博客(MicroBlog)的简称,它是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。根据用户使用微博的行为记录,可以分析出用户的行为习惯、个人偏好、意识形态、身份、职业、是否有危害性等多方面的个性化信息。随着微博用户的数量呈指数级速度的增长,以及微博对社会实体以及意识形态的影响愈发重要,故微博用户的行为的分析对舆情监测显得尤为必要,因此对微博用户行为分析对网络安全、舆情控制、舆情引导等方面都有着深远的意义。微博用户行为分析,就是对微博用户的行为进行分析,通过分析出来的结果,可以快速了解一个用户的基本特点和潜在规律。本文采取了基本的统计分析与数据挖掘相结合的分析方法,实现了对微博用户的立体式挖掘,本文实现主要的内容如下:1、对单一用户进行基本行为分析,即根据用户发帖、转帖、评论数量,粉丝的变化数量,用户的发帖时间等用户基本行为。2、对单一用户进行兴趣分类,即根据用户所发表的相关博文,或者转发的相关博文,使用数据挖掘中的分类算法,将该用户在各个预定义的类中各打一个分类值分数,看其更倾向于属于哪一个或者几个类。3、特殊类用户的甄别,即根据用户所发表的博文,或者转发的相关博文,使用统计分析的方法,将该用户的博文中所命中的预定义的特殊类的情况统计分析出来,看其是否构成特殊类用户。4、群体用户行为分析,即对共同拥有某一个爱好的群体,进行分析,具体分析方法和前三点相同。5、用户职业预测,即通过将用户的分类值分数(唯一六维向量)与一个已知职业用户的分类值分数做比较,来判定是否是拥有同样职业的用户。6、博主数据库,本文维护和建立了一个博主数据库,保存已分析好的博主信息,以供查询方便。7、指定博主微博维护,即代理制定博主维护其微博,具体是删除针对自己的特定评论,建立黑名单,以及完成取证工作。在银河博思舆情分析系统中,实现了微博用户行为分析模块,通过实验验证了相关研究工作的有效性。
其他文献
中国古代散文历史悠久,是我国文化传统最重要的载体,拥有深厚的精神内涵和艺术魅力。在古代,散文是与韵文、骈文相对的,它是一种不讲究韵律的散体文章。它是文言文中的精华,其示
白癜风是由表皮局部功能性黑素细胞进行性破坏、脱失所致,全球平均发病率为0.5%-2%。白癜风的黑素细胞损伤可由多种因素共同作用所致,其中氧化应激损伤及自身免疫机制是黑素细
目的:探讨自行研制改造的可调式中药熥敷保健颈托对治疗神经根型颈椎病的应用价值,分析该颈托的作用原理,观察神经根型颈椎病患者应用该颈托治疗后的疗效,从而为临床合理应用
【目的】1.分析个体化营养治疗对T2DM患者血糖控制及部分血液生化指标的影响,为T2DM患者合理饮食提供参考;2.分析个体化营养治疗对T2DM患者细胞免疫功能的影响,为T2DM患者合理饮
教学模式是目前工程教育改革的一个关键问题。传统的演绎式教学模式并不适合工程人才的培养。本文首先探讨了归纳式教学法的原理,然后对各种常用的归纳式教学方法作了全面的
多目标跟踪技术因其在军事和民用领域发挥的巨大作用,一直是一个备受关注的研究领域,性能稳定且高效的跟踪滤波算法是多目标跟踪技术研究的核心,也是本课题研究的重点和难点。随
<正>综合标准化与传统标准化比较有许多特点,其中主要的是:1、整体性所谓"整体性"也可以说是"系统性"。从认识论和方法论的角度来说,就是从整体出发考虑问题,或者是用系统观
制造业作为国民经济发展的基石,是推进区域经济高效发展的主要动力,制造业结构变动和空间分布的研究是国内外学者关注的焦点。江苏省是我国的经济强省和制造业大省,研究江苏省的
本文通过对物流人才市场的调查,北航与国内外高校物流管理专业课程设置的对比,及对北航物流管理专业教师与学生的调查,分析了北航物流管理专业课程体系设置的不足,结合专业建
此论文将以莱考夫的概念隐喻理论为基础,结合《围城》中的概念隐喻,展开一个以原著及其英文译本中的概念隐喻为研究对象的调查性和解释性研究。本文将通过穷举法找出书中所有的