面向增量式文本聚类的层次可视化方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:seraphim0113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
层次可视化技术方法主要针有层次结构的数据信息,能够良好高效地反映出层次结构数据信息的结构信息和内容信息。文本聚类后的结果是具有层次结构的,而增量式文本聚类需时刻动态的对文本数据进行聚类操作,而聚类结果往往是动态变化的。本文针对层次结构数据的下行展示需求及视图的高效可读性需求,提出了一种面向增量式文本聚类的Venn图可视化方法。结合增量式文本聚类结果的层次结构特征,针对传统基于Venn图的层次信息可视化方法的不足,依据文本的热度属性对节点圆进行排序,形成节点圆序列,针对原方法中的无向性,引入了方向角的概念,改进了传统方法中节点圆排列方法,并以此对增量式文本聚类结果进行初始可视化,提高了视图的可读性;而后针对增量式文本聚类的增量特性,提出了增量式的节点圆排列方法,对新增节点圆进行布局,使增量前后的可视化视图发生较小的变化。算法验证证明了方法的有效性,满足层次下行的需求,提高了视图的可读性,并展现增量式文本聚类的增量特性。本文针对层次结构数据的上行展示需求,提出了一种面向增量式文本聚类的力导引可视化方法。结合增量式文本聚类过程和结果的特征,针对传统力导引方法在层次结构信息应用中的不足,依据父节点所处层次以及下层父节点自身的属性差异,动态改变节点与节点之间的作用力系数,并人为的改变当前节点的父节点对当前节点的叶节点之间的作用力系数;而后针对增量式文本聚类的增量特性,提出增量式的节点布局方法,对新增节点进行有效布局。算法验证证明了方法的有效性,能够突出子树间的差异,满足层次上行的需求,体现了增量式的聚类过程。
其他文献
围绕以上思路,该文的研究工作分六章展开,共20万字.第一章,选题的理论意义.该论文为什么以基于中国企业核心能力提升背景的合作创新若干机制研究为研究课题呢?其理论传承是什
制造业信息化是以信息化带动工业化,促进我国传统制造业结构调整和优化升级的必然选择。为此国家科技部设立了国家制造业信息化工程这一重大专项。区域制造业信息化是国家制造
目标管理是一种先进的管理制度.实行目标管理,始于目标的制定,细于目标的分解,实于目标的完成,终于目标的考核,以目标来激励员工的自我管理意识,激发员工行动的自觉性,充分发