论文部分内容阅读
专利文本集的可视化有利于发现专利之间隐含的关系或聚类结构,进而实现技术趋势预测、技术跟踪、竞争分析等。专利文本向量化后形成的文本向量是典型的高维数据,采用经典的降维算法难以得到所期望的可视化效果。认为专利文本向量化后形成的高维数据实际是低维流形,需要采用有效的流形学习来实现降维,通过对比两种最新的流形学习方法,结果表明局部线性嵌入方法最适合于专利文本的可视化,将其应用到基于专利的创造支持系统取得了较好的可视化效果。