【摘 要】
:
[目的/意义]概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型
【机 构】
:
中国科学院文献情报中心; 中国科学院大学经济与管理学院图书情报与档案管理系;
【基金项目】
:
中国科学院文献情报中心青年人才领域前沿项目“基于引用内容关联的多维主题演化研究”(项目编号:G1726)研究成果之一
论文部分内容阅读
[目的/意义]概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程]通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论]目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。
其他文献
随着互联网的普及,网络渗透到人们的生活中,影响着人们的行为方式、思想方式和生活方式。互联网的发展和应用在给人们生活带来便利的同时也对传统伦理道德形成挑战。因此,正
2019年中国现代渔业职业教育集团第一届职业学院大学生水产技能大赛于11月9日在湖北生物科技职业学院隆重开赛。本次大赛由中国现代渔业职业教育集团主办,湖北生物科技职业学
飞行疲劳与飞行任务能否顺利完成及事故的发生有着直接关系.目前判断疲劳的指标以空勤的主观感觉为主,缺乏客观指标.针对疗养期间如何恢复飞行疲劳,我院制定了以下措施:
为获得能够显著促进核桃生长的根际解磷微生物,本研究采用溶磷圈法从河北省不同地区土壤中筛选根际解磷细菌,通过形态学、生理生化指标和分子生物学手段进行鉴定,并验证其对核桃
介绍了胶印油墨的化学组成中颜料、连结料和附加料对废纸脱墨浆质量的影响及其相应关系.
于2015年8-9月对黄、渤海海域进行现场调查,研究了海水中二甲基硫(DMS)、β-二甲巯基丙酸内盐(DMSP)、二甲亚砜(DMSO)的浓度分布、相互关系及影响因素,测定了DMS的生物生产与
汽车摇晃着进入县城,路边积雪未化,月光照得树影婆娑,昏黄的路灯把两旁低矮的楼房隐藏严实,大街小巷已经人迹罕至,我是在2013的正月十五深夜去的喀左,一个偏远的蒙古族自治县
关键词是科技论文的文献检索标识,能反映文章主题概念的词或词组,关系到文献的被检索利用情况。文章从关键词的选取范围、选取原则以及首标词的选择三个方面,探讨了如何合理
本文着重阐述在信息技术新课改中培养学生情商的重要性,并重点介绍如何在信息技术新课改中进行情商教育的四点行之有效的切身体验。这样做,有利于促进信息技术新课改的深化和发
<正>当前,劳模创新工作室已成为职工自主创新的一股清流。2011年起,宁波舟山港下属的镇海港埠分公司(以下简称"镇司")陆续成立了"胡耀华创新工作室""戴光麒创新工作室"和"屠