基于改进的变分推理的潜在狄利克雷模型研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ltzmh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题模型是一种用来挖掘文本隐藏主题的统计方法,以潜在狄利克雷分配模型(Latent Dirichlet Alocation,LDA)为代表的主题模型方法能对文本信息进行自动组织和归纳,解释文档的潜在语义,分析海量信息中蕴藏的主题。变分推理是用于含有隐变量模型的学习和推理的方法,主要用于求解近似贝叶斯模型中的后验概率,而LDA模型恰恰是一种基于贝叶斯学习的主题模型,可以用来很好地求出每篇文档的主题分布。本论文以基于变分推理的LDA模型为研究课题,针对变分推理的变分分布和KL-散度(Kullback-Leibler)的改进做了进一步的研究。首先,对于变分分布,传统的想法是把它定义成平均场形式来简化模型,使得多维分布的每个变量都相互独立,对于高维的情况的确作了很大的简化。然而在实际应用中,一些变量之间是有一定的相关性的,针对维数不多的情况,这种假设在一定程度上破坏了变分推理的精度。基于此,本文取消了变量间的独立性,对模型进行了改进,来加强变量之间的依赖性。其次,对于证据下界,传统的方法是利用KL-散度来定义两个分布之间的相似度,进而推出证据下界的表达式。这里不再仅仅用KL-散度来定义分布间的相似度,而是结合χ~2-散度和KL-散度的定义,进而得到一个新的优化目标。利用这种度量方法,使算法同时具有χ~2-散度和KL-散度的优势。最后,本文分别将两种改进了的变分推理法应用于LDA模型的参数估计中,进而得出文本的主题分布,然后与传统的变分推理在LDA模型上的应用进行对比。通过计算模型的困惑度,可以得到改进后的模型的效果比传统的模型更佳。
其他文献
中国航天科技集团有限公司基于自身行业特点、资金安全特性和资金管理模式,提出了司库体系建设方案,按照司库制度与信息系统、司库与财务共享中心、系统建设与布局应用三个“一体推进”的途径开展司库体系建设,构建了“业务报账——共享核算——司库结算”的一体化流程,资金“安检”模式升级,切实推进资金管理集约化、初步实现资金管理数字化、有效实现风险防控实时化,稳步助推价值创造能力提升。
期刊
探讨国产低剂量非晶硅平板C形臂X射线机在骨科临床手术中的应用效果,根据骨科临床应用需求,对X射线发生装置、图像采集装置以及曝光方式等方面进行了分析,重点分析不同类型探测器的C形臂X射线机在技术和临床应用中的优点与缺点。国产低剂量非晶硅平板C形臂X射线机能够更好地满足临床应用需求,在满足临床应用效果的评价中,能够更好的满足临床手术需求,获得更佳应用效果,同时能有效的减少散射线与患者的辐射剂量。
期刊
《蛙》为诺贝尔文学奖获得者莫言的一部史诗小说,由美国著名汉学家葛浩文翻译完成。葛浩文被誉为“中国现当代文学的首席翻译家”,其对中文和英文的熟练掌握以及个人独特且具有创造性的高超翻译手法被人称赞“读葛浩文的翻译小说仿似读英文原创小说,却并无置身美国社会的感觉。小说翻译,乃至文学翻译的最高境界正在于此:以富有文学价值和审美意义的文学作品进入异域翻译文学,达到文化交流的目的。”(吕敏宏,2010:175
学位
思政课是落实立德树人根本任务的关键课程。要增强思政课的思想性、理论性和亲和力、针对性,就必须坚持建设性和批判性相统一,传导主流意识形态,直面各种错误观点和思潮。将“社会思潮辨析”融入“思想道德与法治”课教学是引导青年成长、赢得青年、提升思政课教学实效的必然选择。针对现实教学中对社会思潮不敢辨、不愿辨、生硬辨等困境,以“社会思潮辨析”为主线或抓手重构教学体系、整合教学要素,进而提升思政课教学实效。
期刊
近年来,译者主体性已成为翻译研究领域的热门话题,研究者们对译者主体性进行了全方位、多角度、深层次的探讨,基本确立了译者的主体地位。在整个翻译活动中,从文本的选择,到原文的解读,再到译文的建构,对文本风格的再现等,译者都发挥着至关重要的作用。译者主体性首先体现在文本的选择上,译者对文本的选择不是随意的而是主动的,需要同时结合自身的主观因素和客观因素来选择翻译文本。其次,译者对原作的分析和解读也是一种
学位
期刊
期刊
本论文对于“过去分词”这一研究对象,在句法-语义界面做出了新的探索。与传统语法和近年来一些研究(如:Wegner 2019)所持的过去分词的一形多(功能)义的观点(即表达完成体、构成被动语态、作形容词性的修饰语和谓语)不同,本文提出并论证了过去分词是同形异(功能)义的观点,认为过去分词的三个主要语法功能分别对应了三个同形异义的分词形式,即:完成分词、被动分词、形容词性分词。其中,前两个形式属于同一
学位
思想政治理论课的改革与创新、思政课教师的专业成长以及思政课教学之科学化传统的形成均离不开教学学术。加强思政课教学学术研究,既与思政课教学特点有关,也是增强思政课教学有效性的内在需求。思政课教学学术的核心在于解决如何开展更有效的教学的问题,其着力点主要在于对思政课教学内容建构、教学过程组织、学生学习活动引导、教学评价改进等科学规律及其应用的研究与探索。思政课教师要使教学学术成为专业行动自觉,需强化教
期刊
本研究基于社会网络分析和攻防博弈模型,拟对微博辟谣中的企业谣言信息进行整合处理,形成基于主题词的谣言信息关联网络和谣言信息攻防博弈模型。通过对谣言传播和应对两个阶段的扩展,借助社会网络分析和博弈论模型对企业谣言信息进行解析,形成企业谣言信息本身的谣言的内在关系网,进而根据谣言信息的核心程度对其进行分级。此外,本研究还探讨了逆向干预对谣言传播效力的影响,为谣言应对方式的探索及干预信息传播的合理性提供
学位