基于多视角聚类模型的微博文本数据挖掘算法研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:successyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种能够同时考虑关键词和发生时间的新型算法。该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取。仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点。
其他文献
“别让孩子输在起跑线上”在当前的中国社会能够产生巨大的影响,其原因是复杂的,有历史的,也有现实的,但归纳起来,主要有:  1.学历社会的直接产物。学历社会是指在决定一个人的社会地位时,学历比其它因素更具有决定性作用的社会。也就是说,学历社会是以文凭为中心、学历至上的社会。在学历社会,文凭的地位至高无上,就业、晋升、流动、社会声望等主要受学历高低的影响。  “别让孩子输在起跑线上”就是学历社会最为直
以球作为贮能单元,建立了球体内凝固过程的数学模型,并用Lighthill奇异摄动法给出了球体内对称凝固问题的近似分析解,以Ba(OH)2·8H2O为相变材料,得到了相变介质温度、冷
潘飞声是清朱民初一位学贯中西的著名学者,曾在德国柏林大学任教四年,归国后在香港任报社主笔十三年,晚年在上海加入“南社”,被称为“南社四剑”之一。潘飞声编有《粤东词钞三编
今天,我们在这里隆重召开西华师范大学人才工作会议。会议的主题是:加速推进"人才强校"战略,创造人才成长的良好环境,为建设高水平师范大学提供强有力的人才保障。
根据车轮运动学和动力学原理,从定义入手结合受力分析对驱动轮的动力半径和滑转率进行了深入分析,阐明了驱动轮运动状态与动力半径和滚动半径之间的关系,并对驱动轮动力半径
在45钢的基体上,选用不同的激光功率、扫描速度、送丝速度等,用专用焊丝进行堆焊处理,结果表明当速度不变时,随激光功率增加,其热影响区变大,组织由细变粗,硬度增加;当其它条
近年来因农用运输车所造成的交通事故不断发生,且逐年呈现上升势头,本文从驾驶员的因素、车辆自身因素以及驾驶环境条件、职能部门的监管等方面对农用运输车交通事故的原因作
差速器壳体是东方红FIAT 80-90上的关键零件之一,该件的内部不允许有缩孔、缩松等铸造缺陷,否则会影响整机的使用质量.然而,由于该件结构具有的特殊性以及材质本身要求高等问