基于LDA的微博用户主题图谱构建及实证研究——以“埃航空难”为例

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:xsl_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]基于LDA构建微博用户主题图谱,更准确、有效地识别微博用户主题群体特征并有针对性地识别意见领袖,对网络舆情进行有针对性的引导,降低舆情监控成本.[方法]构建基于LDA的微博用户主题图谱过程模型,利用困惑度评价指标确定微博用户的最优主题数和主题分布;利用JS散度对微博用户的主题进行相似度度量,并将JS散度作为边权重构建主题图谱.以新浪微博“埃航空难”话题为例,进行用户群体主题偏好、主题用户群体特征以及主题用户意见领袖识别的讨论分析.[结果]数据结果表明,基于LDA的微博用户主题图谱不仅可以利用微博用户的主题对其进行聚类,还可以准确定位每个主题下的意见领袖.[局限]LDA的最优主题数的确定过程是一个超参数的寻优过程,缺少先验的确定方法,时间复杂度相对较高.[结论]研究结果可为舆情监管部门识别不同主题群体的特征和意见领袖提供一定的指导.
其他文献
[目的]对只有少量标注的文本进行高效率的分类,提出一种新的半监督文本分类方法.[方法]提出DW-TCI半监督文本分类方法,通过使用双通道的特征提取方式得到基分类器组的两组特
[目的]针对社会化问答平台场景,构建深度神经网络模型,改善查询推荐的效果.[方法]以Yahoo Answers和Yahoo!L6为基础构建实验数据集,基于语义匹配矩阵、变长卷积层和多层感知
[目的]利用专利知识图谱计算专利术语之间的相似度,从而计算专利文本之间的相似度以判断专利是否侵权.[方法]利用已构建的新能源汽车专利的知识图谱,结合术语的概念层次结构
【摘要】信息技术的不断发展,拓宽了学生学习的渠道,也为教学模式注入了新的生机与活力。当前,由于现代教育不断地革新,诸多院校的教学模式都趋向多元化发展,初中英语教学也逐渐地优化。我们可以充分利用现代信息技术,优化英语教学模式,提高学生的英语综合素养,加强学生对英语知识的运用能力,培养学生的英语口语交际能力,从而提高初中英语教学机制的不断完善。  【关键词】网络环境 中学生 英语听说能力  引言  随