【摘 要】
:
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文
【基金项目】
:
国家自然科学基金(No.71172219);安徽省自然科学研究项目省级重点项目(No.KJ2011Z039,No.KJ2013A053)
论文部分内容阅读
隐藏狄利克雷分配(Latent Dirichlet Allocation,LDA)模型被广泛应用于文本分析、图像识别等领域.但由于LDA及其扩展模型多为无监督学习模型,无法将其应用于分类任务中.本文通过研究文档标记与LDA模型中主题的映射关系,提出一种新的Labeled LDA模型(Shared Background Topics Labeled LDA,SBTL-LDA).在SBTL-LDA模型中每个标记除了存在若干个独享的局部主题外,还存在若干个共享的背景(Background)主题,这样可以有效分析不同标记所含主题之间的依赖关系,而文档标记被映射为局部主题和共享主题的组合,因此SBTL-LDA模型可以有效提升文档标记判别的准确性.同时SBTL-LDA模型还可以看成是一种半监督聚类模型,在对文档进行聚类分析的过程中模型可以有效的利用文档的标记信息提升文档聚类效果.实验证明SBTL-LDA模型能够有效解决PLDA模型中主题之间的相似性和依赖关系,具有良好的多标记判别能力,并且具有优于LDA、PLDA模型的文档聚类效果.
其他文献
大学生的心理健康教育是大学生思想政治教育的重要内容。大学生心理问题具有复杂性和多样性特点,如适应性问题、原生家庭关系问题、人际交往问题、恋爱情感问题、就业压力问
本文以中国知网CNKI数据库为数据源,采用文献计量学方法对国内发表的高级氧化研究的文献进行了分析,主要分析指标包括发文数量及增长趋势、发文期刊及学科方向、发文机构及作
零、引言目前中国大学预科教育主要有三类,即少数民族预科教育、华侨预科教育和来华留学生预科教育。中国政府奖学金来华留学生预科教育(以下简称“公费留学生预科教育”)是
2019年6~7月赣江中游的暴雨强度大,中游控制站吉安水文站发生中洪水,部分支流洪水超历史。江西省防指科学决策,调度万安、峡江等水利工程发挥水库拦洪、削峰、错峰作用,产生
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
近几年来,随着我国城市化的进程,人们的生活质量和居住条件有了明显提高.但是,我国与欧洲部分居住条件较高的国家相比较而言,住宅建设与设计仍然处于粗放型发展的阶段,住宅精
供电营销稽查管理信息系统依据供电营业规则对现有营销信息系统数据进行挖掘再利用,将营销各环节的工作进行细致分析,从数据中发现问题;从管理上要效益,使稽查员能够有目的对管辖
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
糖尿病足仍然是糖尿病最严重的并发症之一,其病理生理关键的因素是周围神经病变、血管病变和皮肤组织的非酶糖基化反应。糖尿病患者的步态改变与软组织的生物力学改变相结合,