基于人工智能领域论文文本的主题发现和演化研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:xuliyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2019年,政府工作报告明确表示深化大数据、人工智能等研发应用,进一步扩大人工智能应用场景。由于人工智能领域的最前沿研究往往聚集在顶会会议论文上,对顶会会议论文文本的挖掘,对于理解人工智能的发展脉络、把握人工智能的学术热点话题有着重要作用。基于此,本文选取了人工智能领域顶级会议NeurIPS(原NIPS)自1987年创办以来到2019年共9680篇会议论文作为研究对象,首先从描述分析层面,对Neur IPS的论文作者机构、标题文本内容和论文数量及话题丰富度的时间分布做了全局分析。随后在主题算法层面,创新性地使用多单词(n-gram)作为关键词粒度搭建主题模型,在对文本进行预处理后,测试不同单词数作为关键词粒度的效果并最终选取三元词组(3-gram)作为主题关键词最终粒度以得出含义清晰、指向性强的关键词集合,结合ATM作者主题模型和DTM动态主题模型对Neur IPS论文文本进行主题发现,得到多年来人工智能领域会议论文的整体主题分类划分和各主题的时间动态演变,主题的静态分布反映了人工智能领域论文的研究方向分类,动态模型则捕捉了特定研究方向的重要程度及热门程度的变化。对NeurIPS论文的整体的分析表明,人工智能领域受到学界和业界的共同看好和关注;深度神经网络的突破性进展,带动了机器学习、人工智能领域研究和应用,人工智能领域论文数量和论文主题丰富度均在近年迅速上涨。对NeurIPS论文的主题的静态分析表明,NeurIPS会议论文主题主要包括有监督学习、无监督/半监督学习以及强化学习三个方向,涵盖了人工智能领域的基本方法,静态主题模型很好地捕捉了论文文本的主题,划分准确全面。主题词对相关领域的刻画角度较为丰富,各主题内的关键词既包含该方向的具体算法,也包含算法的典型应用场景,或是相关联的算法概念。论文关键词词频变化的角度可以看出,早期对于人工智能的探索多以传统机器学习方法为主,但近些年来人工智能的论文和研究往往趋向于使用更大的模型、更深的网络、更多的参数以实现更好的模型效果。人工智能领域论文主题随时间的变化来自往往以下两个原因(1)全新方法的出现带动了相关领域大量新的研究产生。(2)市场对于特定领域算法的需要带动相关领域大量研究产生。动态主题模型捕捉了NeurIPS论文文本随时间的动态变化,并以主题关键词的概率排序反映了特定方法的研究和应用热度。主题中关键词概率稳定排序较高的,往往是主题中关键的逻辑或算法。稳定排序较高的趋势表明,在循环神经网络这类算法中,“长短期记忆网络”是重要的一种循环神经网络,持续性地保持其研究和应用热度。而在强化学习领域内,尽管近年来model-free方法非常流行,与之相对立的model-based方法依然是强化学习的主流并被广泛研究和应用。关键词概率有所下降的,表明一类算法热度有所下降,如在2010年前热度较高,近些年研究热度下降的“尖峰时间依赖可塑性”(STDP)算法。关键词概率有明显上升的,是近年研究的热点,如强化学习主题中的“深度神经网络”和“分层强化学习”,半监督/非监督学习主题中的“生成对抗网络”等。强化学习领域学术研究的趋势变化为:(1)深度神经网络被广泛用于强化学习领域。(2)分层强化学习尽管并不是一个新的研究领域,但却是强化学习领域当今比较流行的研究方向。半监督/非监督学习领域的趋势变化为:(1)生成对抗网络自提出以来,有较高的研究和应用热度,被视作人工智能领域最有前景的方向之一。(2)由生成对抗网络衍生出一系列生成类模型,在近年的半监督/非监督学习领域有主导性的地位。
其他文献
主观幸福度作为近年来多维社会指标体系中逐渐被关注的重要变量,其不仅可以用来对单个社会成员的生活体验情况进行整体评价,也能够用于评估群体的社会现象。本文将职业女性这个群体作为研究的对象,探究她们的主观幸福度影响因素,主要研究女性一生中重要的两个节点——婚姻与生育对其主观幸福度产生的影响以及作用路径。本文的研究主要基于中国家庭追踪调查(CFPS)2018年的数据,在文献综述的基础上,经过描述与探索分析
学位
论文以鄂尔多斯盆地东缘大宁-吉县地区山西组页岩为重点研究目标,将野外剖面踏勘及岩心观察作为基础,结合后续一系列的分析测试数据,在沉积构造的大环境背景之下,理清研究区沉积相及平面展布特征;建立页岩划分方案并描述各类岩相特征;明确各类岩相所对应的储层特征,结合国内外优质页岩评价方案,对本次划分的页岩岩相进行优劣评价,识别出有利页岩相,为未来勘探开发提供一定的理论基础。研究区地处晋西挠曲带南部,左邻伊陕
学位
断层对油气的封闭性是由断层垂向和侧向封闭性构成,忽略某一项,将导致对断层封闭性的误判。如何进行断层封闭性的综合评价,断层封闭性与油气成藏的关系是什么,断裂在多大程度上控制了油气成藏等问题,值得深入研究。本论文以西湖凹陷平湖构造带为例,开展断层封闭性及其控藏作用研究。西湖凹陷平湖构造带位于我国东海海域,是我国最大的断陷式凹陷之一,构造带内穿断古近系平湖组的张性正断层极其发育,平湖组下段发育优质的烃源
学位
断裂构造控制着油气的成藏,厘清断裂特征和形成机制对研究构造油气成藏具有重要意义。彬长地区位于鄂尔多斯盆地的西南部,处于盆地内部三个一级构造单元的衔接部位,属于盆缘构造活动强烈与盆内构造活动较弱的过渡区域,其内断裂发育。为了进一步明确研究区断裂特征及形成机制,在资料收集与文献调研的基础上,通过高精度三维地震解析,对研究区断裂的构造样式以及平面特征进行分析,以此精细刻画出研究区内断裂的几何学特征,恢复
学位
为了深入分析研究常见建筑保温材料的燃烧性能,对不同种类的保温材料进行了燃烧性能测试。结果表明,无机类保温材料在防火性能方面明显优于有机类保温材料,并且燃烧性能与其物理、化学特性密切相关,不同种类的保温材料在燃烧过程中产生的现象和有害物质含量等也都有所不同。因此,在建筑保温材料的选择和应用过程中,应当充分考虑其燃烧性能,以确保建筑物的安全和环保。
期刊
2020年既是中国全建成小康社会总体目标的实现之年,也是全打赢脱贫攻坚战的收官之年。消贫困、改善民生、逐步实现人民共同富裕,是社会主义的本质要求,也是我们党的重要使命。脱贫攻坚的伟大胜利,改善了贫困地区的物质生活条件,提了贫困家庭的生活质量,增强了群众的幸福感。中国即将进入“后扶贫”时代,在享受脱贫攻坚取得的胜利果实的同时,也要时刻警惕城市与乡村之经济差距过大,发展不平衡不充分等的存在。绝对贫困的
学位
钱家店砂岩型铀矿地处松辽盆地南部钱家店凹陷内,是我国东部地区发现的首个超大型砂岩型铀矿床。尽管目前对钱家店铀矿的构造背景、成矿特点及控矿因素等方面进行了众多的研究,但对于在东西向不足百公里的小范围矿床内为何能产生巨大矿量的地质事实,仍有许多疑惑和未解之谜。按照中亚水成铀矿理论,矿床规模主要与层间氧化带的规模即地下水氧化时间、还原剂的丰富程度、地下流体铀的沉淀速率即热的作用等因素有关。而钱家店铀矿空
学位
互联网的快速发展为电子商务提供了土壤,网上购物已然成为许多人日常生活中不可或缺的一部分,而一个好的购物体验离不开物流配送环节。单量即订单数量,关系着物流侧的工作强度以及计划安排,对于那些与电商紧密相连的物流企业来说,单量预测是非常重要的一环,企业可以预测单量为基础,制定一系列库存计划,进行人员、设备的调配,实现资源配置优化,降低运营成本。另外,精细且准确的单量预测,有助于企业实现快速高效的物流配送
学位
由于新冠肺炎疫情走势的不确定性,各国的经济复苏进程不一。在数字经济加速发展、产业链重塑和金融市场波动加剧的格局下,突如其来的新冠肺炎疫情增加了许多新的金融风险和挑战。在本世纪过去的二十年中,极端风险的发生与蔓延均对相关国家金融体系安全造成严重冲击。由于当前金融机构间普遍存在的关联性特征,聚集的金融风险可能产生溢出效应,即当某一金融机构遭遇风险情况时,随着自身风险在逐步积累,与其在资产、负债、合作等
学位
新冠肺炎疫情自爆发以来迅速在全球蔓延,毒株的变异更是增强了新冠肺炎病毒的传播能力,欧美地区感染人数仍在飞速增加,中国部分地区也出现多轮疫情反复,新冠肺炎疫情仍然影响着人们的正常生活,威胁着人们的生命健康。在新冠肺炎将长期与人类共存和疫情防控常态化的背景下,迅速对具有流行病学史或发热等临床症状的病例进行筛查诊断,将有效阻止新冠肺炎在人群之中传播和扩散。胸部CT影像,作为新冠肺炎确诊的重要诊断依据之一
学位