论文部分内容阅读
随着经济全球化的发展,技术创新已经成为推动当今世界发展的重要动力。对企业和政府来说及时把握技术创新的机会至关重要。技术创新潜力强调技术领域当前的发展阶段以及未来的发展趋势和发展空间。专利文献是技术创新的成果和表现形式之一,使用文本挖掘技术对专利数据中技术的生命周期进行研究具有重要意义。首先,将专利文本数据转化为结构化的专利主题数据。分析专利数据的内容和特点,选取专利数据中用于技术主题提取的文本数据。对专利文本数据进行分词,并将分词结果中的无用词停用。经过向量空间模型、TF-IDF模型、隐含狄利克雷模型处理,输出结构化的专利主题数据,为专利技术生命周期探测方法提供数据输入。其次,定义技术主题的生命周期阶段并介绍生命周期阶段的探测方法。对使用多个指标探测主题生命周期的方法进行研究,定义技术主题生命周期的3个阶段:潜在阶段、新兴阶段和成熟阶段。根据专利数据的特点,优化新颖度指标,提出使用分类号数量计算的技术范围指标。借鉴使用发文量指标的探测方法,使用技术范围指标探测技术主题的生命周期阶段。再次,针对使用发文量指标的探测方法使用指标过于单一的问题,使用授权量指标代替发文量指标,在此基础上加入技术范围指标进行扩展和补充。使用授权量指标和技术范围指标结合改进使用发文量指标的探测方法。最后,以汽车领域的专利数据为例对探测方法进行验证。提取汽车领域的技术主题,对每个主题的生命周期阶段进行判断。对使用授权量指标的探测方法、使用技术范围指标的探测方法和使用授权量指标与技术范围指标结合的改进方法的实验结果进行对比和分析。