基于论文数据的重要科学成果挖掘

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:tianjinajun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,世界发生着翻天覆地的变化,科技人才和科研成果创新成为了推动着社会进步、百姓富裕、国家繁荣昌盛的最重要力量,也是国家在未来国际关系中决胜的关键。过去对于科研成果的评价体系中,主要是以情报人员、研究人员和专家学者为主导进行评价总结,使得评价结果不够准确和客观,专家人工筛选所有资源和研究成果的工作量非常巨大,成本很高。通过梳理近几年来对于科学论文重要性评估的评判标准,发现大部分的分析方法是利用科学论文的引用信息构建数学模型拟合出科学论文的重要性,而且使用的信息主要是论文引用,采用的很多方法都是移植社会科学、经济管理学和数学等学科的成熟模型,而利用机器学习等方法评估科学论文重要性的文章较少。因此本论文重点关注如何利用多源的科学论文信息以及统计机器学习等方法来构建出客观、高效、实时的重要科学论文挖掘模型,阐述了科学论文的定向采集算法,构建了重要科学论文挖掘的图结构模型,分析了热点的研究方向。在科学论文的统计分析基础上本论文还对科学论文的重要性深入挖掘,将论文的引用、下载量、浏览量、社交网络和新闻媒体等因素结合成多源特征,在论文发表后的早期,构建了以月份为单位的时序多源特征和论文发表后两年内的状态多源特征,更加细致地刻画了科学论文早期的发展与状态情况。针对时序多源特征结合神经网络的过拟合问题,提出了新的EW-Dropout算法并嵌入LSTM模型中构成LSTM-EW优化模型,并在多源科学论文数据集上取得了85.55%的准确率和73.87%的召回率,有效地提高了模型的稳定性。将本论文构建的LSTM-EW时序优化模型和XGBoost状态模型融合取得了82.23%的准确率和80.61%的召回率,召回率远高于单个SVM、RF、XGBoost等传统机器学习模型和一些LSTM优化模型,表明了基于时序特征和状态特征的融合模型能够挖掘到更多的重要的科学论文成果。本论文也给重要论文成果的评估提供了一个新的思路,减轻了专家评估科学成果工作量,有效地利用了科学论文的互联网社交信息,结果也更加的客观、高效、准确。
其他文献
目的探讨伏立诺他联合PI3K抑制剂NVP-BEZ235对T淋巴细胞生长增殖的影响,并探讨其作用机制。方法体外培人T淋巴细胞白血病细胞系Jurkat细胞,用不同浓度伏立诺他或(和)NVP-BEZ235孵育后,采用MTS观察两者单独用药或联合用药对细胞的增殖的影响,并计算药物的联合指数;选取联合用药后细胞半抑制浓度(IC50)组合用于下一步研究,包括流式细胞术检测细胞凋亡;Western blot检测
机器人具有效率高、重复机械动作和在恶劣环境中工作的能力,在经济生活、工业生产中获得广泛地应用。轨迹规划设计是机器人执行动作的重要组成部分,它决定机器人定位和精度运行效率。传统的轨迹规划方法使得工业机器人在上料时容易出现上料时间过长,以及机械臂振动造成上料位置不准确等问题。本论文以6自由度机械臂上料过程为研究对象,以给定关键点为基础(关键点通过多次示教的方法选取),研究了机械臂结构模型搭建、轨迹规划
网络对讲机因其价格低、通话质量优和通信距离长等优点,被广泛地应用到工业、安保和消防等领域。随着网络对讲用户数剧增,原有网络对讲交换平台突显出了两大问题:面对大量对讲交换任务并发时,平台交互速度变慢、稳定性变差;存储在平台上的对讲语音数据增多时,文件检索效率低、安全性差。Hadoop分布式文件系统(Hadoop Distribute File System,HDFS)进行大数据处理时具有较高的安全性
基于属性加密实现用户细粒度访问控制,然而解密计算量大,密文完整性无法验证,不适用于现实场景中使用。可验证外包属性加密能够减少解密计算量,同时实现消息完整性验证,保证系统安全。因此,构建安全和高效的可验证外包属性加密方案成为目前研究的热点。论文针对具有不同功能的可验证外包属性加密方案进行深入研究,具体包括:(1)针对可验证外包属性加密方案中的属性撤销问题,本文在标准模型下提出一种安全的支持属性撤销可
目的:本临床研究通过利用导师长期临床经验用方干预脾虚痰浊型的血脂异常,观察其中西医临床疗效和安全性以及对肠道菌群、脂联素、瘦素的影响。材料与方法:本临床试验基于课
随着移动设备的普及和移动应用用户数量的爆发式增长,移动智能终端安全面临着巨大挑战。机器学习作为人工智能领域的重要方法,近年来在通过分析网络行为进行移动恶意应用检测的研究中得到了广泛应用。然而,由于网络流量天然存在的类别分布不平衡特性和持续到达特性,给机器学习模型训练带来了诸多困难与挑战。首先,在真实环境中,正常行为的网络流量数量要远远多于恶意行为的网络流量数量,这种类别不均匀分布的数据集使得传统的
目的:研究结肠癌转移相关基因1(metastasis associated in colon cancer1,MACC1)对人鼻咽癌细胞恶性生物学行为的影响,观察人鼻咽癌细胞过表达MACC1对细胞的增殖、迁移及侵袭的影响。方法:1.采用Western blot技术检测鼻咽癌5-8F、HNE-1、CNE-1、CNE-2细胞株中MACC1的蛋白表达水平。2.通过慢病毒转染技术建立一组过表达MACC1的
近年来,机器学习技术与传统的通信技术有了更多的交集。现代的通信系统在运行过程中会产生大量的数据,将其与先进的机器学习技术结合能够显著提升网络的性能并优化通信组件的设计和管理。在这一领域,最近提出了一种利用端到端训练对通信系统组件进行联合优化的方法。本文利用这一思想,对单载波频域均衡(SC-FDE)系统进行信道估计与信号检测。本文主要工作如下:(1)首先,针对单天线SC-FDE系统,利用深度学习网络
目的1.描述妇科癌症患者和配偶的心理资源(包括正念、心理灵活性)与负性情绪(包括抑郁、焦虑情绪)状况;2.探索妇科癌症患者和配偶正念、心理灵活性对抑郁情绪、焦虑情绪的二
卷积神经网络(Convolutional Neural Networks,CNN)近年来在图像分类、目标检测、视频语义分析等领域取得了突破性的进展,其强大的特征学习与分类能力得到广泛的关注。由于卷