【摘 要】
:
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测。本文对概率主题模型LDA(Latent Dirichlet Allocation)进行了
【基金项目】
:
本文系教育部人文社会科学重点研究基地重大项目“面向决策的企业信息资源集成研究”(批准号:2009JJD870002)的研究成果之一.
论文部分内容阅读
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测。本文对概率主题模型LDA(Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析。为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析。通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势。
其他文献
耦合流数据分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多学者的关注,但现有研究成果大多依赖于从单个流数据中提取特征并进行分类,没有考虑到流数据内以及
1公猪栏如果饲养环境恶劣,必须慎重考虑提供坚固、隔热较好的猪舍给猪休息和采食。种公猪舍可以建在临近中心服务栏处。因为公猪在各自栏中会感到孤单,尤其是其对温度的变化比
<正>原发性支气管肺癌绝大多数起源于支气管黏膜,是当今世界上发病率、病死率最高的恶性肿瘤之一。非小细胞肺癌(NSCLC)约占肺癌人口的87%[1],其中发现时已是晚期水平的患者
教职工的身体健康是学校发展的重要保证。作为以高级知识分子为主体的特殊群体,高校工会通过组织开展全民健身活动可以增强教职工健康的身体和改善其精神状态,缓解教职工精神
机器人与智能装备制造行业已成为本世纪最有发展前景的行业之一。“工业4.0”时代为全球机器人行业创造了一个崭新且广阔的发展空间,我国作为新兴市场中的传统工业大国,已经
为了系统、全面、准确的反映动物消化道基因工程研究演进及知识间的联系,本研究以与该专业科研人员互动为基础确定检索式,通过高级检索,采用多元统计、战略坐标、社会网络分
本报北京2月1日讯 见习记者陆宇航报道 1月30日至2月1日,农发行在京召开全国分行行长会议,深入学习贯彻习近平新时代中国特色社会主义思想和党的十九大精神,全面落实全国金融工