论文部分内容阅读
随着科技的发展,人们在各领域的研究越发深入,科技文献的数量也随之增多,在为我们提供了更多新方法和新知识的同时也带来了新的问题:海量的文献资源与人们的阅读时间和利用能力形成了矛盾,阻碍了人们对科技文献的利用。本文面向期刊论文进行知识挖掘研究:其一有助于科技管理人员把握期刊整体结构及发展现状,从而帮助相关人员针对期刊建设做出合理的决策;其二从大量的科技文献中发现主流主题及其演化情况,可以帮助科研人员减少查阅科技文献的时间,便于对科技文献进行整理和总结,把握学科前沿方向,对科研人员的研究具有一定的指导意义。本文通过对2000-2011年间某期刊论文进行统计和分析,呈现了该期刊在研究队伍、地域分布、基金资助及其主题内容等情况,以揭示该期刊研究的趋势和特征。本文的主要工作和贡献如下:1.研究分析了科学计量学、主题模型的基本理论和方法,并应用科学计量学方法和主题模型对期刊论文进行了知识挖掘。2.应用科学计量学方法对期刊论文的作者、机构、基金资助等内容进行了挖掘,实验结果可以帮助相关人员针对期刊建设做出合理的决策,为期刊的评价提供了量化依据。3.把主题模型方法引入期刊论文挖掘,挖掘出了主题分布、主题变化等知识。本文给出“主题共现”方法来描述主题情况,相对于传统的关键字共现的方式,具有描述清晰简洁、语义明确的特点。实验表明,主题模型方法应用于中文期刊论文知识挖掘,具有较好的效果。可以帮助科研人员减少查阅时间,便于对科技文献进行整理和总结,正确把握学科前沿方向。