基于术语向量表征的新兴技术量化识别研究

来源 :中国科学院大学(中国科学院文献情报中心) | 被引量 : 0次 | 上传用户:liuhuimin002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新兴技术识别一直是科技创新管理、科技政策制定和技术竞争情报研究领域关注的问题。就科技创新管理而言,新兴技术识别可以作为先导研究提升科研基金资助的效率;就科技政策制定而言,新兴技术识别能够帮助科技政策制定者根据当前产业与技术的发展态势随时调整政策布局;就技术竞争情报而言,新兴技术布局有助于企业管理层及早确定研发重点、明确投资方向以及降低投资风险,帮助国家战略决策层做好长期规划,抢占先机,保持技术竞争力。本研究基于新兴技术的定义,立足于计量视角,将新兴技术的识别任务转化为通过对新兴技术特征的量化评价实现判定与预测。基于向量表征模型,对应前人研究的不足,本研究主要解决了以下三个问题:一是针对“识别方法过于关注定性分析未关注技术语义”的问题,建立了融合语义结构信息的BERT-GAE术语向量表征模型,以量化新兴技术主题;二是针对“数据时效性制约问题”,基于表征得到的术语向量和链接预测模型,提前测度技术主题的科学影响力,弱化科技文献的时滞性问题,真正地做到了结合未来的预测信息来研判新兴技术;三是针对“新兴技术量化特征体系不完整”问题,建立了新兴技术多指标协同量化研究模型,从时间维度上的“过去”、“现在”及“未来”三个视角量化新兴技术。具体得,本研究主要进行了以下三部分的研究内容:第一部分是技术术语的抽取及表征研究。技术术语是表征技术的最小粒度,如何准确地获取和表征对于后续技术主题表征和新兴技术识别至关重要。为展现技术术语之间的关联特征,本文首先基于The termolator开源术语抽取模型得到科技论文中的技术术语,以摘要为单位构建技术术语共现网络;而后,建立融合BERT语义特征的无监督图神经网络BERT-GAE模型,将共现网络结构信息和术语语义信息表征在技术术语向量中,从语义对比和网络结构复现两方面评估向量表征方法效果,得到术语向量,为后续实现链路预测和技术主题特征的量化计算提供助力;第二部分是在准确获取技术术语和术语向量之后,建立术语向量与新兴技术主题之间的转换关系,以及基于三大新兴技术指标(交叉融合性、新颖性和潜在的科学影响力)建立新兴技术量化识别模型。其中,前者基于术语向量运用Mini Kmeans方法聚类得到技术主题,作为新兴技术主题的筛选范围;后者则主要具体为:基于主题向量计算主题向量间的cosine相似度用于量化主题间的交叉融合性特征;基于术语向量进行链路预测得到预测的未来术语共现网络,而后计算其中术语及主题的Pagerank值,作用于量化主题的潜在科学影响力特征;基于术语--主题的对应关系,计算每一主题内术语最早出现时间的均值用于量化主题的新颖性特征。最后,综合考量三个特征值,将排名靠前的主题作为筛选得到的新兴技术主题。第三部分是基于前两部分构建好的新兴技术识别模型,以航空领域为实证,识别并验证该领域的新兴技术。在构建好技术术语共现网络之后,以单纯基于语义信息的BERT模型和单纯基于结构信息的Node2Vec模型为基准模型,通过语义对比和结构复现两大指标进行评估,验证了本研究提出的BERT-GAE模型的术语向量表征效果最好。基于此,采用分层聚类的方法获得候选新兴技术主题;而后根据每一主题内所属的技术术语向量计算主题向量,进而计算三大新兴技术指标值识别得到新兴技术主题。最后,本研究识别到的新兴技术主题在战略政策及工业应用中得到了印证,同时研究结果还寻求领域专家验证,得到了专家认可。综上,本研究通过引入“术语向量表征”的计算视角,有效编码了术语实体间显性和隐形的关联关系,提升了技术主题识别的粒度,还加强了新兴技术特征计算的客观性;同时结合历史、当前和预测的信息,从外部结构的网络结构特征与文本内容的主题关系两方面入手,构建了一套完整的新兴技术量化识别体系。经实证发现,识别效果得到了领域专家的认可。
其他文献
随着金融全球化的发展,金融行业对我国经济产生着重要的影响,银行业作为金融行业的支柱,而城市商业银行作为银行业的重要组成部分,在我国经济的快速发展中也在如雨后春笋般的飞速发展,加之近些年互联网技术突飞猛进的发展,城市商业银行想要可持续稳健发展,就必须实时调整其发展方向与全方位的改革。但在城市商业银行的转型发展中,为在激烈的竞争中开拓盈利空间,就不可避免的会产生各种各样的金融风险,此时,监管机构必须对
学位
同城化作为我国城市化进程发展到一定阶段的区域发展趋势和形态,它出现的基本条件应该归纳为自然、交通、历史人文和经济等方面的相近和相通性。内江自贡是川南地区的老工业城市,它们在空间距离、交通运输、产业结构、历史人文等方面具有很大的相似性。2018年11月,省政府首次提出内江自贡同城化发展,将其作为川南经济区一体化发展的实践。医疗保障作为同城化发展的重要组成部分,医疗保障一体化对城市之间协同发展或者区域
学位
科研诚信是科技创新的基石。在我国日益重视科研诚信的背景下,科技期刊出版诚信作为科研诚信体系的重要一环,已引起国内各利益相关方的重视。随着科技的进步与科学研究的发展,科技期刊各出版环节均涉及诚信问题,如何防范环节疏漏并客观有效地对科技期刊出版诚信建设现状进行衡量和评估成为新课题。尽管科技期刊诚信建设在学术界与出版界有一定的研究与实践基础,但尚未见到对科技期刊诚信评估体系的系统研究,科技期刊也缺乏较为
学位
常规配电网优化配置方法的经济性较差,基于此,本文提出考虑源网荷协同的配电网分布式光伏储能多目标优化配置方法。建模配电网各分布式储能设备的出力,并结合源网荷协同规划建立储能优化配置模型,设计约束条件,引入混合粒子群算法求解模型,得到最佳优化配置方案。测试结果表明,设计的储能优化配置方法运行总成本更低,可提高配网运行经济性。
期刊
氯丁橡胶塑身衣是一种可外穿的运动型塑身衣,由于其面料特殊的三层复合结构,可内外复合不同面料,得到不同的服用性能,内层复合不透气面料可辅助运动排汗,提高瘦身塑形效果,因此很受运动健身爱好者的欢迎。与普通内穿塑身衣不同,氯丁橡胶塑身衣有其自身的特点,文章针对目前市场上的该类型产品,从面料、款式、结构三个方面进行详细分析,并探究其改进和发展方向,为氯丁橡胶塑身衣产品的生产研发提供参考。
期刊
中医药是中华文明瑰宝,在全民健康中发挥着重要作用,十八大后,习近平总书记高度重视中医药发展与应用,强调要“坚持中西医并重,传承发展中医药事业”。在中医领域建设知识图谱,从海量非结构化的中医科技文献中抽取结构化的“临床研究”知识体,补充中医临床研究知识库,支撑中医领域语义搜索、智能问答、决策支持等知识服务,有助于挖掘与利用中医药知识。构建知识图谱需要结构化的信息作为数据基础,从非结构化的科技文献文本
学位
中国正从“制造大国”向“智造强国”战略转型,以科技创新为核心的创新驱动发展战略已上升为国家战略,国家和企业对创新的需求不断提高,主要体现在产品快速迭代的需求、技术交叉加剧的需求和创新知识集中汇聚的需求。在当前的时代背景下,创新已经不仅仅是依靠个人灵感而产生的想法,而更需要科学的方法和依据给予突破。TRIZ创新方法通过对专利大数据的挖掘分析,形成了一套指导人们进行发明创新的系统化的方法学体系,可以准
学位
科技期刊传承人类文明,荟萃科学发现,引领科技发展,直接体现国家科技竞争力和文化软实力。我国科技期刊作为学术交流主渠道、科研成果首发竞争主战场,在科技创新、国家创新建设中发挥着重要作用。目前,在利好发展政策推进、科研人员关注增加和技术变革支持等方面对我国科技期刊发展提出要求的同时,科技期刊与科学研究发展严重不匹配的问题仍然突出,这同样要求我国科技期刊要高质量发展以提高整体竞争力。因此探究影响我国科技
学位
以“一带一路”倡议、京津冀协同发展、长江经济带发展、粤港澳大湾区建设、长三角一体化发展、黄河流域生态保护和高质量发展为代表的重大国家战略正深刻影响着我国社会全面发展的进程,各地区、各行业机构都将在战略政策的推动下展开新一轮发展,图书馆这一典型的文化机构也不例外。顺应图书馆机构转型的发展趋势,把握战略宏观环境为图书馆带来的历史性机遇,积极响应战略号召,结合馆际区位特点和机构功能优势,围绕重大国家战略
学位
新时代的人力资源服务业有着新的发展特点和机遇,在粤港澳大湾区、深圳建设中国特色社会主义先行示范区“双区驱动”的背景下,中山市人力资源产业发展面临重大的发展机遇与挑战。近年来,中山市人力资源产业发展有了较大进展,但与粤港澳大湾区周边城市相比,人力资源发展在产业定位与政策扶持、发展规模与发展潜力、市场化与集聚化发展程度方面存在较大差距。为了破解中山市人力资源产业发展难题,政府应强化人力资本发展理念、提
期刊