论文部分内容阅读
进入21世纪以来,以美国为代表的西方发达国家和中国为代表的新兴经济体都在大力提倡发展人工智能。我国人工智能产业的整体规模和综合实力与美国还存在一定差距,但部分领域也已处于领跑状态。近年来,人工智能相关研究文献和专利数量的快速增长,导致针对人工智能研究及应用本身的科学计量、演化模式和应用前沿等重要问题的研究相对滞后,而且针对主要科学问题的阐述也并不充分,甚至部分领域还存在研究盲点。针对人工智能研究及应用演进模式的量化分析、主题建模和内容挖掘,无疑对于我国相关科技或产业政策的制定具有重要的决策参考价值和管理实践意义。为进一步刻画过去三十年的人工智能相关研究及应用的演进模式,本文搜集了22万多条文献数据和2.9万余条已公开的专利数据,从文献计量和主题建模的综合视角开展相关的量化研究,并尝试提出启发式的管理和科技政策建议。首先,本文基于WOS(Web of Science)收录的人工智能文献数据和德温特(Derwent Innovations Index)收录的专利数据,利用文献计量工具绘制人工智能研究及应用的知识图谱,探究过去三十年人工智能的研究热点、重要技术前沿的演进模式,并对研究和应用热点领域进行了分类和主题粒度的细化。其次,本文基于LDA(Latent Dirichlet Allocation)模型,结合一些新的概念和测度方法(主题间距离、专利转化强度和专利转化效率等),提出了一个综合分析框架,并对上述人工智能相关文献和专利数据进行主题建模(Topic Modeling),从内容挖掘(Context Mining)的角度深入提取了不同时段人工智能细分主题,并进一步量化主题的演化过程和技术转化模式,主题建模实验结果也证实了新测度指标的可靠性。作为一篇信息系统和知识管理相关的硕士学位论文,本文的创新点主要有:(1)从一个较为系统的视角探索了人工智能的内涵与边界,并给出了一个较为综合的文献和专利检索式;(2)提出了主题间距离的概念及计算方法,并进一步量化了研究主题的内容演化的分析过程,提出了一个基于传统LDA算法的综合分析框架;(3)从文献-专利耦合新颖视角,提出了专利转化强度和专利转化效率两个概念和测度公式,并用来评价人工智能的技术转化程度,从而辅助识别人工智能技术应用领域的潜在创新机会。