【摘 要】
:
随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用
【机 构】
:
CAD&,CG国家重点实验室
【基金项目】
:
国家自然科学基金(61472354), 国家高技术研究发展计划(863)(2012AA12A404)
论文部分内容阅读
随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用户的领域专业知识对模型结果进行修正.针对这一问题,提出了一个交互式可视分析系统,帮助用户对主题模型进行交互修正.首先对层次狄利克雷过程进行了改进,使其支持单词约束;然后,使用矩阵视图对主题模型进行展示,并使用语义相关的词云布局帮助用户寻找单词约束,用户通过添加单词约束迭代优化主题模型;最后,通过案例分析及用户研究来评价该系统的可用性.
其他文献
结合工程测量的特点讨论了GPS工程控制测量数据处理内容;介绍了在此基础上研制的GPS工程控制网数据处理软件(GDPS3.0)的结构、功能以及该软件的应用实例。
我国损伤致死病人约10余万,损伤病人,中估计1/4死于胸部损伤,另外1/4的死亡与胸部损伤有关。胸部损伤中受累的器官和组织多,有肺和支气管损伤,心脏大血管损伤,膈肌损伤,胸壁和骨骼损伤
对建筑施工企业在建筑工程投标中的典型决策问题,如投标项目选择,投标项目的中标可能性评,企业投标报价确定等进行定性与定量相结合的理想论分析,构造了相应的决策模型。通过对这
根据野外观察与实验资料,运用沉积学原理及水文地球化学理论对雨花台砾石层岩性特征以及地下水的地质作用进行了有益的探讨,以利对雨花台组砾石层的工程地质性质作出更加准确
技校英语教学要注重文化背景知识的介绍,将语言教学与文化背景知识的教学有机地结合起来,培养学生使用语言的能力.
应对与人的心理健康一直具有十分密切的关系,多年来也一直是西方应用心理学研究的热点问题。在面对压力时,作为一个重要的影响变量,人格必然影响人们的应对方式与心理健康的
SIMD扩展部件是近年来集成到通用处理器中的加速部件,旨在发掘多媒体和科学计算等程序的数据级并行.控制依赖给发掘程序中的数据级并行带来了阻碍,当前,无论基于loop-based还是SL
非刚性点集配准是当前多个领域中的一项重要研究问题.现今流行的配准算法通常使用基于单一特征的对应关系评估与包含单一约束条件的空间变换更新,而单特征与单约束限制了其配准效果与应用领域.提出了一种基于双特征高斯混合模型和双约束空间变换的非刚性点集配准算法.首先定义了双特征描述子,并用全局特征和局部特征构建它;随后,基于此描述子将高斯混合模型改进为双特征高斯混合模型.定义了局部结构约束项,并与全局结构约束
课程改革对职业技术教育教师的素质提出了更高的要求。本文针对中职学生现状,主张结合学生实际施教,既要调动学生学习的积极性,又要将各种能力的培养贯穿于课堂教学中。
精化检测是一种重要的形式化验证方法,将系统实现和性质规约用相同的形式化语言进行建模,如能证明两者间存在某种精化关系,且该关系能够维持性质,可得出系统实现满足性质规约