【摘 要】
:
随着科学技术的快速发展,其在国家发展过程中的作用日益凸显,发展高科技成为大国之间战略竞争的重要手段。然而每个国家的科技资源都是有限的,一个国家不可能对所有的科研领域进行支持。因此,科学研究前沿的洞察和识别,对于科研管理者和政策制定者掌握科研的进展和动态,以有限的资源来支持和推动科学进步具有重要意义。传统的基于单一数据源(例如基于论文或专利等)的研究前沿识别结果可能会由于数据单一或限制存在时滞性、局
【机 构】
:
中国科学院大学(中国科学院文献情报中心)
【出 处】
:
中国科学院大学(中国科学院文献情报中心)
论文部分内容阅读
随着科学技术的快速发展,其在国家发展过程中的作用日益凸显,发展高科技成为大国之间战略竞争的重要手段。然而每个国家的科技资源都是有限的,一个国家不可能对所有的科研领域进行支持。因此,科学研究前沿的洞察和识别,对于科研管理者和政策制定者掌握科研的进展和动态,以有限的资源来支持和推动科学进步具有重要意义。传统的基于单一数据源(例如基于论文或专利等)的研究前沿识别结果可能会由于数据单一或限制存在时滞性、局限性等问题。本研究从多源数据融合的角度,将研究前沿识别的数据源拓展到更具前瞻性和战略性的政策文本和科研基金项目数据,采用自然语言处理、文本挖掘等方法进行主题识别,并构造判断研究前沿的指标体系,形成一套较为系统、完整的方法,可以识别某一领域的科学研究前沿,丰富现有的研究前沿探测理论,拓展研究方法体系。本研究梳理了研究前沿的概念、识别方法、数据源、基于政策文本和基金项目的研究前沿判别指标等,阐述了LDA主题模型和Critic客观赋权法的原理,在此基础上构建了基于政策文本和基金项目的研究前沿识别模型。从政策文档库和基金项目网站分别获取两类数据,采用主题模型识别两类数据的研究主题,通过计算JS散度归并两类数据中的共同主题,区分非共同主题;根据政策文本发布的时间、文档数量和基金项目的立项时间、立项数量、资助时长、资助金额等属性分别构造两类数据源中主题的新颖度和主题强度,共同主题在计算指标时还需对两类数据赋予不同的权重来区分其在研究前沿识别中的重要性差异,通过指标判别得到热点、新兴、潜在研究前沿、非研究前沿主题。本文以人工智能领域为例进行实证研究,通过本文构建的模型,得到了20个热点研究前沿主题、4个新兴研究前沿主题、3个潜在研究前沿主题以及2个非研究前沿主题,通过对论文数据进行时间切片的主题分析以及共被引聚类分析,发现有些研究主题比如人工智能在流行病预测、传播和治疗等方面的应用,确实在政策文本和基金项目中出现的时间相对于论文更早,以及本研究识别出的计算神经科学、网络安全、社交媒体等主题并未在论文数据中形成聚类簇,并通过最新的研究报告数据进一步证明了本研究结果的有效性。本研究的创新之处在于:(1)本研究充分利用政策文本的发布时间、文档数量,以及基金项目的立项时间、立项数量、资助时长和资助金额等外部特征信息,采用客观赋权法对上述特征信息指标赋予不同的权重,构建前沿主题新颖度和主题强度等判别指标,使指标体系更加合理完善。(2)本研究充分考虑不同数据源对研究前沿识别的不同贡献,对政策文本和基金项目识别出来的研究主题赋予不同的权重;此外,还考虑了不同层面的政策文本对研究前沿识别的不同贡献,对其赋予不同权重,以此区分不同类型数据源在研究前沿识别中的重要程度。本研究存在一些局限和不足:(1)在主题识别上,采用目前广泛使用的LDA模型,识别的粒度不够精细,未来可借助深度学习方法更好地挖掘语义内容,便于解读。(2)对政策文本和基金项目两类数据源的融合,仅体现在各自进行主题识别后,利用构建的指标对两类数据识别的主题进行融合识别,未来可将融合前置,进行实质的语义层面的融合。(3)由于缺乏权威且全面的政策文本数据来源,政策文本数据采集不全面,可能会对研究结果产生影响。(4)研究前沿的识别应该是全球的,本研究由于数据的获取难度、语言等因素,在实证研究中,仅选取了人工智能领域处于领先地位的美国来做分析,是有所欠缺的,未来可进一步丰富数据源,得到更为全面的结论。(5)政策文本和基金项目二者是相互促进、循环发展的,后续应继续探讨二者之间是如何相互影响的。
其他文献
中医药是中华文明瑰宝,在全民健康中发挥着重要作用,十八大后,习近平总书记高度重视中医药发展与应用,强调要“坚持中西医并重,传承发展中医药事业”。在中医领域建设知识图谱,从海量非结构化的中医科技文献中抽取结构化的“临床研究”知识体,补充中医临床研究知识库,支撑中医领域语义搜索、智能问答、决策支持等知识服务,有助于挖掘与利用中医药知识。构建知识图谱需要结构化的信息作为数据基础,从非结构化的科技文献文本
中国正从“制造大国”向“智造强国”战略转型,以科技创新为核心的创新驱动发展战略已上升为国家战略,国家和企业对创新的需求不断提高,主要体现在产品快速迭代的需求、技术交叉加剧的需求和创新知识集中汇聚的需求。在当前的时代背景下,创新已经不仅仅是依靠个人灵感而产生的想法,而更需要科学的方法和依据给予突破。TRIZ创新方法通过对专利大数据的挖掘分析,形成了一套指导人们进行发明创新的系统化的方法学体系,可以准
科技期刊传承人类文明,荟萃科学发现,引领科技发展,直接体现国家科技竞争力和文化软实力。我国科技期刊作为学术交流主渠道、科研成果首发竞争主战场,在科技创新、国家创新建设中发挥着重要作用。目前,在利好发展政策推进、科研人员关注增加和技术变革支持等方面对我国科技期刊发展提出要求的同时,科技期刊与科学研究发展严重不匹配的问题仍然突出,这同样要求我国科技期刊要高质量发展以提高整体竞争力。因此探究影响我国科技
以“一带一路”倡议、京津冀协同发展、长江经济带发展、粤港澳大湾区建设、长三角一体化发展、黄河流域生态保护和高质量发展为代表的重大国家战略正深刻影响着我国社会全面发展的进程,各地区、各行业机构都将在战略政策的推动下展开新一轮发展,图书馆这一典型的文化机构也不例外。顺应图书馆机构转型的发展趋势,把握战略宏观环境为图书馆带来的历史性机遇,积极响应战略号召,结合馆际区位特点和机构功能优势,围绕重大国家战略
新时代的人力资源服务业有着新的发展特点和机遇,在粤港澳大湾区、深圳建设中国特色社会主义先行示范区“双区驱动”的背景下,中山市人力资源产业发展面临重大的发展机遇与挑战。近年来,中山市人力资源产业发展有了较大进展,但与粤港澳大湾区周边城市相比,人力资源发展在产业定位与政策扶持、发展规模与发展潜力、市场化与集聚化发展程度方面存在较大差距。为了破解中山市人力资源产业发展难题,政府应强化人力资本发展理念、提
新兴技术识别一直是科技创新管理、科技政策制定和技术竞争情报研究领域关注的问题。就科技创新管理而言,新兴技术识别可以作为先导研究提升科研基金资助的效率;就科技政策制定而言,新兴技术识别能够帮助科技政策制定者根据当前产业与技术的发展态势随时调整政策布局;就技术竞争情报而言,新兴技术布局有助于企业管理层及早确定研发重点、明确投资方向以及降低投资风险,帮助国家战略决策层做好长期规划,抢占先机,保持技术竞争
政策扩散是政策过程理论的重要研究领域,现有研究包括两个方面:一是政策扩散特征研究,可分为时空演进特征(如规模、方向或层级结构等)和内容演化特征(扩散程度或主题分布等);二是政策扩散影响因素和机制研究,主要关注影响一项政策采纳的因素和动力机制,多采用回归模型或质性分析。计算社会学的发展为政策扩散研究提供了新的视角,通过数据挖掘技术对政策扩散的过程进行分析,可客观揭示政策扩散规律,进而有助于分析政策扩
社交媒体已经成为学术交流的重要渠道之一,成为学术界交流学术以及与广泛社会公众科学对话的常见场所。几乎每个学科领域都在社交媒体平台上发布了大量可共享的信息资源,包括研究成果、课题信息、同行研究动态等。这种多来源、多维度、多类型的学术信息有较大的学术交流和学术研究价值。社交媒体学术信息结构复杂,与情境密切相关且处于动态交互、不断增长的态势。其易衰减、易消逝等脆弱性特点阻碍了用户对该类信息资源的长期可持
科学研究范式正在经历向数据密集型科研的转变。新的研究范式为科学发展带来新的机遇,同时也对数据资源的有效利用提出了挑战。科技文献数据是科技活动的主要知识来源和知识的主要载体,是科学研究中的重要资源。随着科学研究越发向深入发展,科技文献总量迅速增加,文献研究的内容也在不断细化。前者意味着人类已不可能完全凭借阅读来利用科技文献资源,后者则使不同领域的科学研究之间的潜在关联很难直接被联想和利用,造成了科研
地方特色文献是图书馆重要的特藏资源,承载了地方大量的历史与社会发展记忆,体现了地域文化的核心价值及地方文化传承发展脉络,对于地方社会发展以及区域的政治、经济、文化的发展都具有积极的意义。作为地方记忆保存机构之一的高校图书馆,基于馆藏资源开发地方特色文献资源建设与服务,可以拓展高校图书馆的特藏体系,深化图书馆的教学科研支持功能,是促进高校图书馆内涵建设和服务转型的新机遇和新挑战,业界和学界对此领域的