论文部分内容阅读
随着开放政务的发展,大量记录了科技政策过程的科技政策文本,如科技政策新闻等,在网络上呈现激增状态。大量科技政策文本的可便捷获取,对科技政策研究者或情报工作者是意义重大的,但如何高效、客观地利用这些科技政策文件,是面临的重要问题之一。 在对政策演化等相关研究分析的基础上,论文针对现有研究中存在的问题,首次尝试以科技政策推进中产生的科技政策文本为数据来源,以文本中包含的与科技政策演化相关的多类科技政策实体及实体间关系为研究对象,探索科技政策演化揭示的方法。论文着重解决三个核心问题:(1)如何定义并识别文本与科技政策演化相关的知识内容?(2)能否形成相应的分析框架,指导基于大样本量科技政策实体及实体间关系自动揭示科技政策演化?(3)如何识别科技政策实体的演化路径?针对此,主要工作如下:(1)从科技政策演化涉及的实体类型及实体间的关系入手,构建了基于实体及实体关系的科技政策表示框架;(2)针对科技政策演化关联的各类实体及关系的特征,应用深度句法解析和构建规则库的综合方法,实现了科技政策实体及实体关系的识别;(2)从统计特征、比对不同时段上时序子网络特征、分析时序子网络间实体链接的特征等角度,探索了基于实体及实体间关系自动刻画科技政策演化状态的分析框架;(3)构建了从直接语义关系、直接共现关系、间接共现关连、关联路径衰减指数四个维度综合计算科技政策实体关联的多指标模型,并结合实体时间属性,揭示科技政策演化路径。 研究中,论文以奥巴马执政期间,美国科技政策白宫办公室网站发布的与“STEM education”相关的科技政策文本为基础,构建了实验数据集,验证了科技政策实体及其关系识别的可靠性,从识别出的科技政策实体及其关系数据中,分析出不同阶段的科技政策实体以及彼此之间的关系结构特征,解读出不同阶段政策的状态,并发现了该议题相关的科技政策举措多条发展路径,以及特定实体的前序、后继发展路径。通过人工比对相关的报告,验证了解读出的政策内容的有效性。通过本论文的研究,探索了基于科技政策文本这一资源类型自动揭示科技政策演化的思路,拓展科技政策分析的深度,丰富科技政策演化研究的角度。