在线社会网络用户的兴趣主题分析与地理位置预测

来源 :武汉大学 | 被引量 : 0次 | 上传用户:a5354796
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会发展,人类的信息传播活动越来越明显地展示出分众特征,对用户的细致分类及预测成为信息传播领域一个重要的研究课题。在社会网络中,快速准确地对用户进行分类,寻找相似的在线社会网络用户,预测受众地理位置,对理解用户特点、改善用户体验、提高信息传播效果等方面都具有重要的意义。本文研究用户兴趣主题分类、多属性综合相似用户查找、视频受众地理位置预测,具体内容如下:(1)提出了三种对微博用户进行分类的方法。①提出了基于信息内容对微博用户进行分类的方法,首先使用LDA主题模型从信息内容中提取每个用户的主题分布作为特征值,然后采用支持向量机等模型对用户进行分类。②提出了基于粉丝拓扑关系对用户分类的方法,首先依据我们所发现的具有相同兴趣主题的用户倾向于拥有共同粉丝这一关系,使用平均值法从粉丝交集中提取每个用户的特征值,然后采用支持向量机等模型进行分类。③提出了比较概率估计值和合并特征值两种综合方法,用这两种综合方法把上述基于信息内容分类方法和基于粉丝拓扑关系分类方法的结果综合起来,得到更准确的分类结果。(2)提出基于直觉模糊集发现兴趣、行为、个人信息等多个属性综合相似的用户的方法。首先根据两个用户的某个属性的差值,通过计算相似度和差异度,构造出表示这个属性相似程度的一个直觉模糊数。然后采用集成算子,根据每个属性分别对应的直觉模糊数,计算得到表示多个属性综合相似程度的直觉模糊数。最后对每个表示综合相似程度的直觉模糊数,计算出它的得分值和精确度,并进行排序。多个属性综合相似的用户就是与得分值和精确度排名靠前者相对应的用户。(3)提出了基于k近邻多标签分类的在线视频受众位置预测方法。首先把受众位置预测转换为多标签分类问题,在线视频受众位置预测即是预测视频最受欢迎的地区排名,把在线视频看作样本,把受众地区看作标签,则受众位置预测问题即看成多标签分类问题。然后对经典的k近邻多标签分类方法ML-KNN进行了两点改进:①引入基于权重的样本相似度测量方法,并给出了计算特征权重的方法;②设计了快速查找相似样本的算法,提高了查找速度。在此基础上,提出基于k近邻多标签分类的受众位置预测方法AL-KNN。这三部分的研究内容,都使用了大规模的数据对研究的结果进行了验证:对用户兴趣分类和相似用户查找,使用了最具影响力的微博网络Twitter的数据进行实验验证;对视频受众位置预测,使用了最流行的在线视频分享网络Youtube的数据进行实验验证。
其他文献
利用模糊数学的方法对不同部位牛肉的品质进行了感官评定。结果表明:不同部位肉的肉质之间存在着较大的差别,概括而言,背、腰部肉质要好于臀部和前后腿部位的肉质。因此,在生产中
根据安徽省1989、1994和1999年3次森林资源清查结果,对资源消长进行了动态分析,提出了安徽省林业生产发展中应注意的问题.
明代的宦官之祸影响及清季.然而清军入关后的第一个皇帝却设立了宦官衙门——史称“十三衙门”;康熙皇帝即位后,迅即取消了十三衙门而设内务府,避免重蹈明亡之辙.本文主要研
明代前期,政府采取了有限豢养奴仆的政策,限定了奴仆数量的增长和使用范围 的扩大。由于地权的集中和赋役负担的不均,自中期后导致了基层社会体系的破坏,大量的 自耕农沦为奴仆
诚信是中华传统美德之一,其肇端则在先秦时期。早在《周易·中孚》卦中就已经有了明确的诚信观念,《左传》有关诚信的记载颇多,其中大量的盟誓是当时国家政治层面围绕诚
设计了一种简易高效的医用冰箱及冷库无线报警系统。本文主要从编码电路、发射电路、冰箱开门检测电路等方面介绍了该系统的分机电路设计,从接收电路、解码电路等方面介绍了
中国社会阶层的现状,可以从两个视角来进行解读。第一个视角是阶层分化视角。从阶层分化状态看,改革开放以前的中国社会是一个普遍贫穷的社会,而改革开放以来,中国社会的贫富
DAC1220是采用△-∑转换技术实现的20位D/A转换器,具有噪声低、线性误差小、温漂小等特点,可用串行接口进行3线操作,很适合于灵敏的基于微控制器和DSP的系统。本文简明扼要的介绍
土壤微生物量和土壤酶活性是土壤肥力的重要指标。通过大田试验,研究黑麦草不同翻压量对植烟土壤微生物量及土壤酶活性的影响,结果表明:黑麦草不同翻压量均能够提高土壤微生物碳
两汉魏晋南北朝时期是历史上东西曹存在的主要时段。西曹、东曹最初是西汉丞相的下属办事机构,分别主管府内事务和府外事务;此后作为东汉三公的主要下属机构,职能固定为掌管