【摘 要】
:
从2020年开始,新型冠状病毒肺炎在世界范围内全面爆发,并对全人类的生产生活造成了不可恢复的巨大影响,世界各个国家都损失惨重。以中国为代表的部分国家采取了及时有效的措施,遏制了疫情的发展传播,但是新型冠状病毒的变异毒株却一次次席卷重来,变异后的毒株在暴露条件下生存能力更强,生存时间更久,传染性更强。与此同时,新型冠状病毒肺炎的研究文献数量也急速增长。如果科研人员仅仅通过人工阅读的方式获取相关信息,
论文部分内容阅读
从2020年开始,新型冠状病毒肺炎在世界范围内全面爆发,并对全人类的生产生活造成了不可恢复的巨大影响,世界各个国家都损失惨重。以中国为代表的部分国家采取了及时有效的措施,遏制了疫情的发展传播,但是新型冠状病毒的变异毒株却一次次席卷重来,变异后的毒株在暴露条件下生存能力更强,生存时间更久,传染性更强。与此同时,新型冠状病毒肺炎的研究文献数量也急速增长。如果科研人员仅仅通过人工阅读的方式获取相关信息,巨大的数据规模将消耗大量的时间与精力。疫情迫在眉睫,因此通过生物医学数据挖掘技术获取文献的数据将帮助科研人员推进药物研制以及疫苗研发工作。对于生物医学数据挖掘工作而言,命名实体识别与关系抽取是两个关键任务,同时生物医学命名实体识别又被认为是生物医学关系抽取的一个子过程。生物医学关系抽取的方法分为基于规则的方法、基于统计学的方法和基于机器学习的方法。其中,基于机器学习的方法又可分为基于特征工程的传统方法以及基于深度学习的方法。通用领域的标注语料需要消耗大量的成本,由于生物医学数据的特殊性,因此生物医学标注数据更为稀缺。不依赖特征工程的深度学习方法逐渐成为主流。近年来,在众多通用领域深度学习方法中,“预训练语言模型+微调”的模型脱颖而出并且在各种数据挖掘任务上表现出优异的性能。但其在生物医学领域的工作中仍有很大的提升空间。因此,本文首先提出了一个面向新型冠状病毒肺炎的预训练语言模型,使用最新的新型冠状病毒肺炎的无标注语料,针对新型冠状病毒肺炎的领域性、专业性重新预训练,以此获得了三阶段预训练模型P3模型,提升数据挖掘下游任务的性能。生物医学关系的复杂性使得文本中不只包含简单的二元关系,甚至包含复杂的重叠关系。因此本文的第二个工作提出了一个新型冠状病毒肺炎多关系抽取模型。对于文本中出现的重叠关系本文提出了Entity-position的编码方式,引入实体在文本中的绝对位置与相对位置,将实体对之间的距离作为额外信息加入模型,充分利用各个生物医学实体之间存在的语义关系,提升了关系抽取模型的性能。最后,本文提出了一个新型冠状病毒肺炎知识图谱的构建框架。将新型冠状病毒肺炎的数据通过知识图谱的方式进行存储表示,并基于该知识图谱使用知识推理与时间切片的方法发现潜在的生物医学关系,并且使用路径发现的方法验证知识推理结果的准确性,为新型冠状病毒肺炎的药物研制和疫苗研发提供新思路。
其他文献
<正>研究目的:在"双减"政策落地成功后,众多学校推出了"5+2"的课后延时课程服务。在"双减政策"的大背景下,"校园足球"迎来了了发展的新契机,对"校园足球"新路径的探索与思考也显得尤为重要。正确的理论能够更好地指导实践。通过剖析"双减"政策背景,针对校园足球的现状,深化校园足球发展道路,对其发展路径进行重新的审视、探索与思考。
如何建立一个能够用结构来表示隐藏在领域知识内的分类模型是人工智能领域内的一个关键问题。贝叶斯网络(Bayesian networks,BNs)为不确定性背景下的推理提供了一种紧凑直观的图形表示,并已成为许多概率专家系统的基础。然而,学习一个拥有最优的网络拓扑结构的贝叶斯网络已经被证明是NP-hard问题。自从朴素贝叶斯(Naive Bayes,NB)在良好的分类表现和最小时间开销两方面取得优良平衡
为减小低温对酵母的损伤,提高冷冻面团品质,本课题以馒头酵母、面包酵母为研究对象,考察四种抗冻保护剂(抗冻蛋白、海藻糖、甘油及大豆分离蛋白)对两种酵母的保护作用,通过单因素及响应面优化出最佳复配保护剂配方,并探讨其对酵母及冷冻面团的影响。以活菌率和脯氨酸含量为指标,考察四种抗冻保护剂:甘油、海藻糖、抗冻蛋白(Antifreeze proteins,AFPs)、大豆分离蛋白(Soy Protein I
利用傅里叶变换红外光谱(FTIR)实验及分峰拟合技术,对3种不同变质程度煤样进行官能团的定性与定量研究,计算并分析红外光谱结构参数。结果表明:随煤样变质程度的加深,羟基官能团逐渐增大,羟基-N与环氢键含量减少,羟基-π含量增多;在脂肪烃中,甲基含量升高,次甲基含量下降;含氧官能团逐渐减小,C=O呈下降趋势,羧基在低变质程度煤中含量最高,高变质程度煤几乎不存在羧基;芳香烃逐渐减小,芳香烃主要以三、四
随着“元宇宙”概念的提出,虚拟环境交互技术不断涌现。其中沉浸式虚拟现实技术和增强现实技术是构成元宇宙中重要的一环。文本输入是虚拟环境下最基础的交互行为,然而现有方法存在诸多弊端。目前虚拟环境下主流的文本输入方式是通过手柄激光指向单键输入字符,具有速度慢、准确率低、易疲劳等弊端,不符合虚拟环境下输入需求。没有简易有效的输入方式会导致虚拟环境下应用程序主要功能缺失。文本输入、搜索、填充表单、输入数据和
<正>研究目的:足球历来是我国三大球项目之一,是普及性较高且受广大青少年喜爱的一项运动。近些年由于我国受到应试教育的影响,学生参加足球运动的时间大幅缩水,进而导致青少年体质下降。"双减"政策出台后为青少年足球运动带来了新的机遇,如果我们可以把握好此次机遇,这不仅可以增强青少年体质健康、打磨足球的基本技术和理论知识,还可以促进学生全面协调健康发展。因此,本文从开展校园足球课后服务的现实困境出发,并提
高层建筑结构具有柔度大、质量轻、自振周期长以及阻尼小等特点,这使得风荷载逐渐成为高层建筑结构安全和舒适性的主要控制荷载。当流体流经高层建筑结构时,流体会在其结构表面发生流动分离、再附着漩涡脱落等现象,会在柱体结构周围形成不同的扰流区域及脉动力作用,从而会可能会导致结构损伤甚至破坏。另一方面,同一流场内的多结构绕流,其流动形态复杂多变,在流场中受到的气动力作用可能会大于单一结构绕流时的气动力作用。所
伴随着新课程改革的实施,以“主动参与、乐于探究、交流与合作”为特征的新型教学方式得到了关注,尤其是对低年级的学生来说,此教学方式符合其积极性高、活泼好动的身心发展特点,因此具有较高的可行性。值得注意的是,在新型教学方式贯彻落实的过程中,合作式学习取得了更为显著的成效,有效地提高了学生的体育运动积极性与竞争意识,为体育课堂营造了更为浓郁的合作氛围。为进一步研究新课程改革背景下小学低年级体育课堂中的合
随着越来越多地下空间的大规模开发和利用,在地震发生时,地下结构频繁发生破坏,隧道作为地下结构的重要形式之一,其安全和抗震设防问题引起了世界各国的关注。其中隧道结构的抗震设计主要指的是土-隧道结构相互作用的问题,而影响其最重要的因素之一为土-隧道结构相对刚度,即柔度比(Flexibility Ratio,以下简称F),因而开展F对土-隧道结构体系地震响应影响的系统性研究是一个需要迫切解决的重要研究课
N6-甲基腺苷修饰也称为m6A修饰,是一种广泛存在于真核生物的mRNA和长非编码RNA上的高度保守的转录后碱基修饰。研究表明m6A修饰与许多生物学过程有关,包括且不限于蛋白质的翻译与定位、mRNA的剪切和稳定、RNA的定位和降解等。因此,准确识别RNA序列上的m6A修饰位点具有非常重要的生物学意义。传统的湿实验方法检测RNA中的m6A修饰位点面临着诸多局限性,例如需要耗费大量的时间和金钱、实验处理