【摘 要】
:
如今是大数据时代,深度学习、自然语言处理等教育人工智能技术及应用成为教育技术学界热门研究方向之一,这给通过计算机识别与分析文本带来可能,既满足了信息传播手段进步后人力难以阅读分析教育领域数以千计文献的内生诉求,又为实现智能分析海量文本的主题热点、趋势等提供了探究的可能性,且教育信息化作为教育现代化的重要助推力,其发展及国家政策具有研究意义。本文从文本挖掘技术的角度出发,通过文献调研、内容分析等研究
论文部分内容阅读
如今是大数据时代,深度学习、自然语言处理等教育人工智能技术及应用成为教育技术学界热门研究方向之一,这给通过计算机识别与分析文本带来可能,既满足了信息传播手段进步后人力难以阅读分析教育领域数以千计文献的内生诉求,又为实现智能分析海量文本的主题热点、趋势等提供了探究的可能性,且教育信息化作为教育现代化的重要助推力,其发展及国家政策具有研究意义。本文从文本挖掘技术的角度出发,通过文献调研、内容分析等研究方法,结合数理统计分析,构建基于LDA(Latent Dirichlet Allocation)模型的教育政策文本主题分析研究框架:数据采集--数据处理--主题识别--量化分析,并在此基础上,对我国2011年至2020年教育部和地方省域合计1136份教育信息化政策内容进行了实证研究:10年教育信息化政策主题的智能识别和分析;政策主题的强度、演化和扩散三方面的演进特征和相关规律研究。通过实证研究,初步验证了基于LDA模型开展教育信息化政策主题识别和演进研究的可行性。首先,对文本挖掘和教育信息化政策分析的相关资料进行了文献研究。综述国内外相关研究现状,发现文本挖掘领域中热门的LDA模型方法可自动挖掘大规模文档内容的关注聚焦点和变化情况。接着,在概述文本挖掘相关理论、教育信息化政策相关概念的基础上,梳理LDA模型挖掘主题的基本原理、与政策文本分析的适配性,挖掘出本文研究框架构建的理论基础。其次,构建基于LDA模型的教育类政策文本主题分析研究框架。基于文献研究和实验测试技术的基础上,确定科学可执行的技术路线。重点优化了数据预处理步骤,包括分词、去除停用和低效词、自定义词典、词赋权等自然语言处理,并确定了困惑度计算主题数、Gibbs抽样计算模型参数,通过LDA模型识别主题。然后,从主题强度、演化、扩散三方面构建主题演进特征分析的路径。再次,将研究框架应用于我国2011至2020年的教育信息化政策文本进行实践。经采集得到教育部270份和地方31省866份政策,识别出主题及其在文档的分布结果后按三条分析路径详细探讨主题强度分布、演化、扩散规律等。最后,对教育信息化政策的相关研究结果进行小结与探讨合理建议。研究技术路线具有良好的可执行性、结果具有良好的可识别性,对政策文本的深度挖掘与分析帮助我们把握了国家及各地的政策导向和演进特征,挖掘出潜藏在客观数据下的问题与探讨合理建议能够及时总结经验和审时度势,这对于我国教育信息化政策的研究及制定具有一定的意义。总体上验证了本文构建的利用LDA模型开展教育政策主题分析研究框架具体有一定的科学性与创新性,为其他教育类政策的主题自动识别与分析提供了一种可行的参考方案。
其他文献
全球化采购方式推动了产品与资金之间的自由流动,并使得供应链网络更加复杂化,按照牛鞭效应理论,当供应链的任何一个节点发生了问题都会使下游损失变大,并沿着链条迅速扩散,最后给整条供应链带来了重大风险。近年来由于供应链中的不确定因素越来越多,不论是由于天灾、政治影响、重大公共卫生事件等外部环境中不确定因素的增多,又或是产品质量、产能不足等企业内部环境中不确定因素的增多,都导致供应中断风险发生的频率不断增
H公司是一家通讯硬件设施的高新技术企业。公司涉足多个高科技领域,内部的芯片开发部门HS更是一个纯研发的组织。作为一家高新技术企业,那么大量具有各种丰富知识的员工是企业中最具决定性的生产要素,是企业保持核心竞争力、得到持续发展的主要力量。对其进行绩效考评,是提高员工绩效和组织绩效的重要途径。随着技术发展的日新月异,商场竞争的加剧,甚至于国际形势、贸易摩擦的影响,公司的战略目标,战略规划产生了很大的调
随着全球信息化的迅猛发展,物联网、5G通讯、大数据等对通信系统的性能要求越来越高,大容量、高速光通信网络已是大势所趋。作为光通信系统中使用最为广泛的调制器件,马赫曾德尔调制器具有无法替代的地位。马赫曾德尔调制器是一种电光调制器,通过改变电场可以实现输出光场折射率、相位和振幅的调控,而改变调制器的直流偏置点可以使得调制器工作在不同工作状态下,从而满足不同光通信系统的需求,但由于外界环境变化、器件老化
随着居民个人财富的不断累积,个人理财业务越来越受重视。传统的银行业理财产品营销模式存在高度标准化、忽略个性化需求等问题,难以满足用户的个性化需求且难以拓展新用户。银行需要充分利用自己优势,运用大数据思维、借助数据分析的力量为用户提供更为精细化的理财产品服务。因此,本文通过对银行理财产品个性化推荐进行需求分析,设计并实现了基于群体用户画像的手机银行理财产品个性化推荐系统。本文的主要工作如下:(1)提
我国面临高离婚率的社会现状,为防止轻率离婚,《中华人民共和国民法典(草案)》第一千零七十七条增设登记离婚冷静期规定。登记离婚冷静期是指在离婚自由基础之上,双方当事人向婚姻登记机关申请登记离婚,自婚姻登记机关收到离婚登记申请之日起三十日内,任何一方当事人均可撤回离婚登记申请的思考冷静期间。理论和实务界不乏反对设立登记离婚冷静期的声音,但设立登记离婚冷静期有其合理之处。通过考察其他国家和地区登记离婚冷
本论文为《后长寿时代:健康百岁背后的基因秘密》(节选)的英汉翻译实践报告。在翻译过程中,笔者发现原文中出现大量指代词和衔接词,对于原文的理解造成了一定的困难。因而笔者从语篇衔接与连贯理论角度出发,详细分析了保健类文本翻译实践过程中的典型案例,对翻译中遇到的问题、难点进行分析,探讨此类文本的翻译方法和技巧。本报告由四部分组成:首先简要介绍翻译项目的背景,包括项目的来源、文本的语言和风格特点,以及社科
立体匹配技术一直是计算机视觉领域中的重要研究方向,不仅在理论方面有广泛的研究价值,在人脸识别、虚拟现实、无人驾驶等实际应用方面也具有很大的探索价值。立体匹配技术最大的困难在于复杂多变的环境,当遇到低纹理、重复区域时匹配难度比较高,所以匹配算法性能需要进一步提高来满足应用场景的需求。本文针对基于卷积神经网络的立体匹配算法展开分析和研究,主要的工作和创新点如下:1)为了提高基于双目视觉中立体匹配在弱纹
改革开放以来,我国各类园区经过一系列发展后,一部分有远见卓识的企业将园区配套服务建设成为了业界的标杆。由于各地区的经济发展阶段和产业布局都有所不同,不同地区的服务业在建设过程也存在差异。由于其自身特点的不同,也存在着一系列的问题。随着全国经济的飞速发展,整个云南省的经济也快速增长,产业园区的数量不断攀升,入园企业的服务需求随着产业水平的提升不断扩大,但大部分园区还处在发展的初级阶段,没有完整的园区
针对建筑物立面手工三维建模速度慢、工作量大等问题,提出了一种多细节层次建筑物立面快速建模方法。首先以墙面为基准,窗户为主体,分析各细节部件几何特征、空间分布特征及拓扑关系,设计了一种窗户及墙体多细节层次模型,并定义了各细节层次精细度及所需的结构化特征数据;然后基于三维激光点云数据,提取三维建模所需的结构化特征参数;最后借助MAXscript脚本实现多层级墙体和窗户模型自动化重建,并基于各部件拓扑关
控辍保学是教育扶贫的重要组成部分,也是实现脱贫攻坚的难点。虽然在脱贫攻坚收官年取得了巨大成就,但仍存在部分群众脱贫内生动力不足、部分学生厌学情绪严重的情况,相对贫困的解决任重道远,面对新形势下的贫困形势,贫困文化的延续可能会导致贫困的代际传递。在政府主导的控辍保学工作中,如何激发贫困群众的内生动力,巩固控辍保学成效,让贫困学生通过教育提高“造血”功能,带动家庭脱贫,阻断贫困代际传递,形成控辍保学长