【摘 要】
:
对于信息种子用户的识别在通讯发达的今天具有较为重要的意义,在某些关键的时刻这些种子用户可以发挥很大的作用.将大数据的处理思维应用到种子用户的识别中,与传统方法相比
论文部分内容阅读
对于信息种子用户的识别在通讯发达的今天具有较为重要的意义,在某些关键的时刻这些种子用户可以发挥很大的作用.将大数据的处理思维应用到种子用户的识别中,与传统方法相比能更快更好地得到结果.本文开篇介绍了电信业务以及短信种子用户的相关背景,大数据的定义,大数据的各种特征以及应用价值.接着介绍了关于密度聚类方式和关于递归搜寻方式的树形网络结构用来识别种子用户,然后做了实证分析.由于关于密度聚类算法和关于递归搜索算法的树形网络处理时间太长并且在数据量达到大数据的标准时已经无法处理,所以在第四章是在对如何构建树状模型进行的改进和提升,先分析了影响用户成为种子用户的两大因素:时间优先和属性特征,以及种子信息传播的两大特征:传播时差和方向性.因此,本文针对上述两点提出了一种可以迅速创建树形网络结构,并快速地寻找出种子用户的方法.首先,应对数据进行清洗和数据处理,大数据的处理和清洗的典型方法有,基于函数依赖及蕰含依赖的方法,基于用户自定义约束条件的方法,基于统计学习的方法和基于因果关系的方法.针对种子用户本文选择了较为灵活的基于用户自定义约束条件的方法来对数据进行即先将用户按属性特征,也就是按照行业属性将其分到不同的组中,通过分析计算所有组之间的短信流通关系和传播时差来整理出信息流动的方向,即方向性.从而逐步缩小了搜索范围,也就是只看处于源头位置的组,再通过阀值筛出选备选的种子用户,然后验证备选种子用户,设计合理的种子用户的评价体系,即树状评价模型,将备选种子用户代入评价模型算出的最后得分确定出种子用户.最后,通过两个模型的对比,可以得到改进后的基于信息流模型优于树形网络模型.
其他文献
本文主要通过导子和广义导子研究李超代数和hom-lie代数.在第一部分,我们研究了李超代数的超导子、超拟导子、超型心、超拟型心,它们都是特殊的广义导子,证明了,在通常的运算下,李
戏剧中最重要的语言是角色的语言,也就是“台词”.台词是剧中人物所说的话,是剧作者用来刻画人物,展开剧情,表达主题的主要手段之一,也是整个剧本构成的基本成分.
美国有许多“年龄限制居住小區”,在此小区居住的人,包括屋主及居民,都有年龄限制,一般要求在55岁以上,也有50岁或60岁的,因此泛称“55岁以上小区”。“55岁以上小区”的房价,往往只有周边同类房价的一半或更便宜,但小区规划全面,设有俱乐部、活动中心、游泳池、健身房,以及其他各种生活设施,吸引退休人士居住。华盛顿地区就有不少类似小区,其中规模最大的是“休闲世界”。 “休闲世界”位于马里兰州的银泉
在日本,每次在火车上从车窗看农村的景色,总觉得少了点什么,后来仔细一看,烟囱悄悄藏在房屋墙壁角落里,好像觉得不好意思似的。日本人似乎认为人的生活不应该暴露在外。取暖做饭,是生活中最基础的事情,想把它藏起来。取暖和做饭用的烟囱,也尽量不引人注意,悄悄安在角落里。 在欧洲风光里,放眼就能看到那种赫然挺立的红砖大烟囱,这成为一个家的标志,似乎在大声宣告,这里有人生活。欧洲人不认为这是一件不好意思、应该
讨论有理函数的周期点附近的局部动力系统的性质是复动力系统的重要研究方向之一.已经知道:吸引周期点和超吸引周期点一定属于Fatou集,而排斥周期点和有理中性周期点则一定属
舞台上的道具,可以更加真实地还原故事场景,将观众带入到故事情境中.舞台道具的准备,是表演的一部分.道具的精美、逼真程度,直接决定着舞台表演的呈现效果.但是舞台布景和道
将现代视觉传达设计中融入中国传统文化符号,对于促进视觉传达设计有着极为重要的推动作用.本文对这一问题进行研究,就视觉传达设计中传统文化符号的应用,展开了相关探究.
分数阶微积分已有很长的历史,从其建立一直到上世纪中叶的二百多年中,研究主要集中在数学的纯理论领域里进行,后来由于分数阶微积分应用的拓展,比如刻画具有记忆和遗传性质的材料
爱伦坡是美国著名的小说家,其小说往往展现出与众不同的独特感,同时以其优秀的语言、严谨的结构、丰富的情感成为文学的主要代表,这在一定程度上奠定了其在历史上的独特地位.
算子不等式是算子理论中的一个重要分支。1934年,L(?)wner提出了著名的以后称之为不等式的算子不等式,它是包括Furuta不等式在内的算子不等式的理论基础。1987年日本的数学家Fu