【摘 要】
:
开放共享已经成为大数据时代科研数据服务的发展趋势。国内外现有药学相关共享数据服务主要采用关键词字符串匹配方式检索,检索结果只是依据字符串编码相近或相似,无法从语义信息、分子结构特征等角度提供相似或相近检索,无法提供包含更深层次信息的搜索结果。从语义信息、分子结构特征等多维度研究挖掘数据之间的深层次联系,提供多维度数据检索服务,更有助于提升检索结果的准确度、深度和广度。论文主要从文本语义相似、分子结
论文部分内容阅读
开放共享已经成为大数据时代科研数据服务的发展趋势。国内外现有药学相关共享数据服务主要采用关键词字符串匹配方式检索,检索结果只是依据字符串编码相近或相似,无法从语义信息、分子结构特征等角度提供相似或相近检索,无法提供包含更深层次信息的搜索结果。从语义信息、分子结构特征等多维度研究挖掘数据之间的深层次联系,提供多维度数据检索服务,更有助于提升检索结果的准确度、深度和广度。论文主要从文本语义相似、分子结构相似、融合语义和分子结构相似基础上的数据检索等几个方面开展研究,详细说明如下。(1)在深入分析药学数据特征基础上,针对数据中大量存在的描述性文本数据,基于文本语义相似性展开研究,构建文本语义网络,并针对语义网络构建中的三元组抽取问题展开深入研究,提出融合上下文和依存句法特征的三元组抽取方法,解决药学数据中三元组重叠问题。方法基于BERT获取文本表示向量,实现头实体抽取;基于Bi LSTM提取上下文特征以及基于GCN提取依存句法特征,实现尾实体及关系的抽取,提高了模型对重叠三元组的抽取效果。(2)针对药学数据中存在的分子结构数据,分别从一维和三维特征提取的角度展开研究,并融合一维和三维特征研究实现分子结构相似比较方法。方法共分三步,第一步,针对分子SMILES进行字粒度和词粒度分词,实现基于Word2vec分子一维特征提取;第二步,将分子三维结构映射到三维网格中,实现基于3DCNN的分子三维特征提取;第三步,融合一维和三维特征实现了分子相似计算方法。(3)在构建文本语义网络、融合一维和三维特征的相似性比较等工作基础上,结合数据检索服务实际特征和需要,研究构建融合语义与分子结构相似性的药学数据检索超图,并在其基础上实现高效检索服务。实验结果证明,本文所提出融合上下文和依存句法特征的药学文本数据三元组抽取方法能够很好的解决三元组重叠问题,构建的语义网络能够很好的支持语义检索;融合一维和三维特征的分子结构相似比较方法,能够有效的获取具有结构相似性的分子;融合语义与分子结构相似性的药学数据检索超图,能够从准确度、深度和广度上提升检索服务能力。论文最后针对基于上述研究成果设计实现的原型系统进行详细说明。测试运行结果表明,论文所提出的方法可靠有效,较好的提升了数据检索服务的质量、效率和用户体验。
其他文献
数据的表示方法是机器学习领域的核心问题之一。尽管基于深度学习的表示学习方法在各类领域都取得了重大突破,并广泛地应用在日常生活以及工业场景。然而,随着研究的深入,人们发现这种端到端的学习方法也带来了不可解释的难题。缺乏解释机制以及对抗样本等技术的出现,让人们对神经网络的安全性和可靠性愈发的担忧。如何提高机器学习系统的可解释性,正成为当下人工智能领域最为迫切的问题之一。针对表示学习的可解释性,本文从表
商品平行进口是在国际贸易实践中发展起来的一种贸易模式,各国基于国际贸易利益的不同,对平行进口各持己见。美国、欧盟等知识产权大国为了保护其强大的知识产权经济,为商品平行进口制定了许多限制性规定,追求贸易自由化的国家则倾向允许商品平行进口。由于商品平行进口与知识产权有密不可分的关系,各国的态度通过适用知识产权理论得以体现,所以权利穷竭原则、地域性原则被引入该领域。近年来,我国对外贸易政策不断开放,国际
随着现代行政的发展以及实质法治内涵日益丰富,传统的高权行政行为已无法适应社会的多元化需求,体现柔性执法的行政协议在实践中被广泛应用。行政协议司法审查制度的建立加大了法院对行政机关所为行政行为的监督力度,同时也为行政相对人可能遭受到的来自不当行政行为的侵害提供了有益的司法救济途径,为建设法治型、服务型政府提供了倒逼机制。然而行政协议不同于一般的具体行政行为,在适用传统行政诉讼模式上仍有很多不契合之处
疾病的预防与治疗一直是人类社会发展的首要问题,疫苗在医疗技术发展的今天已经作为对抗传染性疾病的主要手段。新型冠状肺炎爆发的世界环境下,人民群众健康屏障的建立必须有疫苗的支持。但疫苗接种可能产生的异常反应也给受种者造成了人身损害和财产损害,国家对于疫苗接种异常反应损害救济实行补偿责任,但受种者主张补偿时面临一系列困难。因此,对疫苗接种异常反应损害救济制度实施过程中的具体问题进行研究具有相当的意义。首
道岔是火车站电气服务现场的重要设备之一,其状况的可靠性和安全性直接关系到铁路运输的安全运行。转辙机是铁路道岔的核心设备,可实现道岔的变轨和锁定功能,转辙机的工作状态对列车的速度和运行的安全起着决定性的作用。在转辙机监控中,转辙机缺口是转辙机工作状态的重要参数。它反映了道岔在定位和反位之间切换后基本轨与道岔尖轨之间的贴合程度。缺口的过大或过小,显示了道岔运作中可能存在的各种问题,并有可能导致挤岔、脱
近年来个人信息保护面临的压力愈发严峻,个人信息权益受到侵害的数量与程度逐年增加。对于个人信息保护的立法虽已持续数年,但是个人信息保护面临的挑战依然严峻,个人信息法律保护模式研究正是基于现有的这个问题的探索回应。这种回应从个人信息的基本内涵出发,再对我国当前个人信息保护面临的困境与挑战进行分析,然后研究国内外不同国家的个人信息保护模式,最后提出我国个人信息保护模式的完善建议。个人信息的基本内涵从个人
关联企业实质合并破产规则目前已经大量应用于司法实践,但由于没有成文法的指引,实践中呈现出各种不同的操作方法,其中既有平衡处理各方利益的典型案例,也有通过制度漏洞行逃避废债之实的反面案例。为回应实践之需要,特对此展开研究,以推动该规则在我国的立法确立与司法适用。在无成文法的背景下,通过对现有会议纪要、指导规定并结合相关案例进行分析,关联企业实质合并破产规则的适用主要体现在适用标准和程序两个方面。在适
我国县级以上地方人大及其常委会,有权讨论并决定本行政区域内的重大事项与重大项目。作为地方的重大事项,涵盖本行政区内的政治、经济、文化、科技、生态环境、自然资源、民族宗教等一系列直接关乎公民权利、人民福祉、社会安定、国家发展的重大事项与重大项目。作为地方人大及其常委会的基本职权之一,长期以来,其内涵与外延存在界定不清、与地方人大其他职权交叉适用难题、与同级党委决策权、政府执行权的并行适用等问题尚未在
有限责任公司的股权让与担保是让与担保在商事领域与股权相结合出现的新的担保形式,在实践中已经成为非典型担保的重要组成部分。我国中小微企业数量激增,但是在新冠肺炎疫情大流行的背景下,企业融资面临困境,现有的传统融资形式不足以满足企业的发展需要。股权让与担保这一新的担保形式在商事领域应运而生,凭借其特有的优势蓬勃发展。但是与让与担保的发展路径一致,股权让与担保在实践中产生,目前亦主要在实践中被广泛应用,
随着智能终端设备的发展,以获取用户隐私信息和敏感数据为主要目标的恶意应用成为移动智能终端用户面临的主要威胁。移动恶意应用的检测方法主要分为基于静态分析、基于动态分析和基于网络行为的分析方法。基于静态分析的方法重点关注恶意应用的代码层面和可执行文件的分析,该方法无需运行应用,难以应对代码混淆技术。基于动态分析的方法针对应用程序运行过程中产生的事件和行为进行分析,此过程需要将恶意应用在虚拟设备或者真实