一种基于LDA的在线主题演化挖掘模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:rainbow0938
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析。将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异"。实验结果表明,该模型能从
其他文献
基因表达数据的出现,为人类从分子生物学的角度研究和探索癌症的发病机理提供了广阔的前景,利用基因表达数据发现与癌症相关的基因对于癌症的诊断和治疗具有重要的意义。在过
SOA是一种构建软件系统的设计方式,指导着软件设计的整个生命周期。随着SOA的广泛部署,用户在其服务功能需求得到满足的同时,也越来越关注非功能性需求,如服务质量属性。SOA的基
目前绝大部分异常检测方法只利用数据包的头部信息来检测网络攻击,即仅仅从网络层、传输层来分析网络的异常情况。而研究表明现在的网络攻击主要发生在应用层,因此从应用层来分
在MMS(Mobile Multi-Sink)型传感器网络中,多个移动的Sink节点会随时随地查询和收集数据,因此如何有效解决数据的查询和收集是MMS型传感器网络最基本和具有挑战性的工作。首先根
数据立方体选择问题是一个NP完全问题。研究了利用遗传算法来解决立方体选择问题,提出了一个结合局部搜索机制的遗传算法。这一算法的核心思想在于,首先运用一个基于单位空间
Deep Web信息量大,主题专一,信息质量好。然而Deep Web信息存在着不确定问题,因此难以对其进行知识表示和推理。基于动态模糊逻辑理论,提出了一种新的描述逻辑,即动态模糊描
粗糙集的不确定性与其所在近似空间知识粒度的大小密切相关。提出了近似空间中集合的相对知识粒度的概念。基于相对知识粒度的粗糙集的粗糙性度量既刻画了近似空间对粗糙集不
智能化立体仓库对现代企业提高仓储利用率和生产效率具有重要作用。介绍了秦皇岛港务集团公司立体仓库管理系统中仓库货位计算机分配的智能化算法,该算法充分考虑了重量均匀
多域安全互操作是通过认证机制、访问控制机制和审计机制来实现多个分布、异构、自治区域间安全的资源共享和信息交互的过程。系统介绍了这一新型研究领域的理论基础和应用现