论文部分内容阅读
作为一个科研工作者,要掌握整个研究领域的热点主题和发展趋势,需要阅读大量的文献论文。尤其是在将自己的科研成果应用到其他领域时,科研人员需耗费大量时间和精力去探索自己不熟悉的领域知识,来确保自己能够完全了解该领域的大致内容和核心知识。针对上述问题,本文提出了基于知识库的文本可视分析方法,以满足科研人员快速掌握领域知识的热点主题和概念演化情况的需求。 本文围绕基于知识库的文本可视分析的研究与应用,主要完成工作如下: 1.提出了基于知识库的文本可视分析方法。借助主题模型挖掘文档集中的主题信息和主题的内容演化信息;基于专业领域知识库优化主题模型挖掘的结果,以弥补主题模型的缺陷,并为用户提供更多的主题背景知识。 2.给出了多层次多交互的主题信息和演化信息可视化展示方法,以方便用户探索更加详细的内容。通过将主题演化信息映射到标签云主题河流,主题信息映射到标签与和柱状图,CCS分类系统映射到多层流图等多种映射方式,提供用户一个多层次的领域知识展示。 3.为了提高可视分析系统的扩展性、复用性、移植性以及个性化,设计了可视分析框架和可视化应用云平台。通过统一数据接口规范来方便应用技术的复用和移植。利用可视化云平台展示更加个性化的信息内容,用户根据个人感兴趣数据,创建自己的可视化应用。 4.利用JCDL2008-2015年期间近400篇论文数据,对基于知识库的主题分析系统和可视化应用平台进行了准确性评估。