【摘 要】
:
针对微博用户分类问题提出时间片微元的概念,建立了时间片微元模型;对每个时间片内的微博所涉及到的用户进行研究得到时间片微元内部的用户兴趣度向量,最终整合所有时间片内
【机 构】
:
武汉大学计算机学院,徐州工业职业技术学院信息管理技术学院,武汉大学软件工程国家重点实验室,
论文部分内容阅读
针对微博用户分类问题提出时间片微元的概念,建立了时间片微元模型;对每个时间片内的微博所涉及到的用户进行研究得到时间片微元内部的用户兴趣度向量,最终整合所有时间片内的用户兴趣度向量,再对整个时间段内用户的兴趣度向量进行两次朴素贝叶斯分类,得到整个时间段内的用户分类.同时,对微博内容研究上规避了传统的单一的依靠系统标签形成用户网络的方式,结合了自然语言处理技术,提取用户兴趣方向,形成用户兴趣向量,然后对用户兴趣向量分析,采用改进的朴素贝叶斯分类算法进行用户分类.最后是对所提出的方法按详细步骤进行实验,研究结果表明,基于时间片的微博用户分类方法能有效对大规模的微博语料中所涉及到的用户进行较准确分类,为研究微博用户分类问题具有一定推动作用.
其他文献
<正> 我们对合肥市2200名4-14岁儿童做了影响体格发育的遗传,营养和环境因素的研究结果。证明:遗传因素中,体格发育的遗传度(双生子法)身高是0.705,体重是0.494。亲子代体格
介绍了CRH1型制动夹钳试验台的用途、系统组成及测试原理。
<正> 许多人提出了“鸡生蛋,蛋生鸡”的问题,究竟是先有鸡蛋呢?还是先有鸡? 这个问题必须从生物进化的观点,才能得到正确的解答。否则“鸡生蛋,蛋生鸡”是一个循环,不可能回
寻找和充分利用足迹蕴藏的相关信息,是正确分析犯罪嫌疑人个人特征的关键。调查了1500多个样本,根据足迹学相关知识:基本系数S0=所有人总身高/所有人总脚长,得出:基本系数的
持续审计(Continuous Auditing,CA)是目前计算机辅助审计领域中的一个研究前沿问题.本文对CA的研究进行了分析、比较和展望.首先分析了CA的内涵.然后,对CA的相关研究进行了分
在传统基于模拟接口数控系统体系结构分析和研究基础上,针对现场总线的特点及开放式数控系统的要求,设计并实现了一种基于现场总线的开放式数控系统.首先分析传统数控系统存
目的探析不同出生孕周新生儿先天性肾上腺皮质增生症筛查中17-羟孕酮的切值。方法选取我院2014年7月1日~2016年6月31日收治的行新生儿先天性肾上腺皮质增生症筛查的标本547例
<正>据外媒报道,美国空军近日正式决定将运程打击轰炸机合同(LRS-B,也有报道称新轰炸机代号或为B3)给予诺斯洛普·格鲁门公司,洛马和波音公司的方案落选。该机项目是用于取代
文章首先分别概括了我国五大戏曲的英译及其研究现状,然后分析了这五大剧种英译及其研究所出现的问题,文章发现有三个问题值得关注,一是如何面对文化差异问题,二是如何对待文
<正>阿朵:这一期我们将到世界各地取景拍摄原生态生活哦!你想像鸟儿一样感受林中的生活吗?你想体验丛林夜航的神秘感吗?那么就跟随我们一起来树屋旅馆吧!这里有原生态的"鸟巢