基于网络短文本主题挖掘技术研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:zhujiang_doctor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于短文本内容少,在语义特征上短文本要比长文本匮乏的多,传统的主题模型对于普通文档非常有效,然而严重的数据稀疏问题使得短文本主题建模困难。为了解决这一问题,提出了GBDP(Gravity Biterm Topic Model Hierarchical Dirichlet Process)模型,它是一种基于BTM(Biterm Topic Model)的Dirichlet过程,同时结合CRP(Chinese Restaurant Process)不仅考虑词汇之间相关性而且也考虑到了词对之间的联系,最后对实际
其他文献
德国"二元制"职业教育模式被视为经济发展的柱石,世界各国纷纷推广。我国高职院校进行"二元制"人才培养的关注度日渐升高,但借鉴德国"二元制"人才培养模式提高高职商务英语专
目的探讨加强围术期综合性管理在提高成人重度阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea-hypopnea syndrome,OSAHS)患者手术有效率及减少并发症的重要意义。
新冠疫情期间,南京某高职院校在《实用英语》课程中采用融合式在线教学模式,结合SPOC、直播和自主学习三种形式进行教学实践,并通过问卷调查对学生的在线学习投入情况和影响
在智能化家居时代,极简主义理念和简约风格备受人们推崇。探索室内个性化装修风格的表现方式,营造室内简约美的装饰环境,追求低碳环保生活理念。现代室内简约装饰设计包括空
髓鞘少突胶质细胞糖蛋白(MOG,myelin oligodendrocyte glycoprotein)是一种仅在髓鞘和少突胶质细胞膜的最外表面表达的髓鞘蛋白[1],抗髓鞘少突胶质细胞糖蛋白抗体相关疾病(an
在半导体晶圆制造过程中,调整设备相关参数来提高晶圆质量的同时会造成换模时间的增加,从而影响生产效率。并且考虑到半导体晶圆制造可重入的特性,论文对带换模约束的可重入
响应时间既直观反映应用系统的处理能力,又直接影响用户的服务体验,有效地预测应用系统的响应时间对提前感知并解决系统性能问题、提升用户满意度都有重要指导意义。有研究表
依据带噪语音中不同类型语音分段(segment)对语音整体的可懂度影响不同,提出了一种基于语音分段来分类训练深度降噪自编码器(DDAE)的语音增强算法。该算法使得DDAE模型在尽可
论文设计了基于c4.5和BP的颌骨囊性病变诊疗分析系统。对颌骨囊性病变的大数据进行分析处理。系统的分析结果可用于指导颌骨囊性病变的分类、诊断、治疗、预测、评估。实验表
由于社会网络的日益复杂,具有线性时间复杂度的标签传播算法越来越被广泛的运用,然而在标签传播过程中存在随机性,致使社区划分不稳定。因此,对节点标签初始化、节点更新顺序