【摘 要】
:
人工智能时代的到来与智慧校园的广泛建设,已经积累了越来越多的校园数据,如何合理充分地利用大学生校园大数据是一大研究热点。构建高质量、高可用性的大学生校园日常行为活动数据集是充分利用大学生校园数据的基本前提。对大学生校园日常行为活动进行分类、构造行为标签存在数据量大、数据冗杂、数据噪声多以及分类约束条件过多、过于复杂、人工标注工作量大、繁琐等问题。基于此,本文提出一种基于双层条件随机场的大学生日常行
【基金项目】
:
“AI2030”新一代人工智能重点项目“混合增强在线教育关键技术与系统究”,项目编号:2020AAA0108804; 国家自然科学基金项目“大学生个性化日常行为习惯的可解释发现框架与数据驱动干预机制”,项目编号:62177017;
论文部分内容阅读
人工智能时代的到来与智慧校园的广泛建设,已经积累了越来越多的校园数据,如何合理充分地利用大学生校园大数据是一大研究热点。构建高质量、高可用性的大学生校园日常行为活动数据集是充分利用大学生校园数据的基本前提。对大学生校园日常行为活动进行分类、构造行为标签存在数据量大、数据冗杂、数据噪声多以及分类约束条件过多、过于复杂、人工标注工作量大、繁琐等问题。基于此,本文提出一种基于双层条件随机场的大学生日常行为活动数据自动分类模型,利用大学生校园日常行为活动及其产生数据之间的时间与空间约束关系,对数据进行自动分类,并打上对应的行为标签。本文的主要工作如下:(1)采集并处理大学生日常校园行为活动数据。数据涉及四个学院共1845名学生,时间为2018年秋季-2019年春季学年度,数据内容包括学生在校行为活动数据、学生基本信息数据、学生消费数据、Wi-Fi登入登出数据、图书馆门禁数据以及借阅数据。建立学生活动模型,得到的一个包含学生校园日常行为活动发生时间、活动发生具体位置信息,活动描述的多源融合大学生校园日常行为活动数据集。并且构建活动数据分类标准。以校园大数据为基础,构建时空语义约束模型,提取活动数据,定义活动行为分类标准,为后续的大学生行为自动分类创建分类标准。(2)构建用于活动数据自动分类的双层条件随机场模型。由于大学生日常行为活动数据复杂,单层条件随机场无法充分计算数据之间的长时间关联关系,并且利用活动间发现的时间和空间联系,引入全局变量和时间、空间转移函数,提出双层条件随机场模型,实现对学生校园内复杂的活动关系进行描述。(3)建立双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)约束的双层条件随机场模型(BiLSTM-CRFS)。充分利用BiLSTM层输入的过去和未来的标签信息,来预测当前的行为标签,实现对活动数据构建相应的行为标签。通过对比实验证明,本文提出的BiLSTM-CRFS模型确实有效提高了行为分类的准确率,相比于传统的聚类方法来说,本文的模型大大提升了分类的准确率和合理性;与常见的时间序列分类模型进行对比,本文提出的模型在学生活动数据集上有更好的表现。本文的创新点:(1)以校园大数据为基础,构建时空语义约束模型,提取活动数据,引入全局变量和时间、空间转移函数,来对学生校园内复杂的活动关系进行描述,构建双层条件随机场模型,实现对活动数据的自动分类。(2)提出基于双向长短记忆网络约束的双层条件随机场模型,以活动的时序与空间相关约束,为活动数据建立相应的行为标签,实现活动数据的行为自动标定。充分挖掘大学生校园日常行为活动数据,全面考虑大学生日常校园行为活动特点,利用校园内的时间和空间约束,构建高质量、高可用性的大学生校园日常行为活动数据集。
其他文献
随着互联网的高速发展,各类文本数据呈现爆炸式增长,信息过载问题日益严峻。面对海量的结构化文本(如知识图谱、软件代码)或非结构化文本(如新闻、社交媒体),如何快速、有效地从中获取关键信息并将其组织成精简连贯的语言表达形式变得尤为重要。作为缓解信息过载及提高信息获取效率的关键技术之一,自动技术旨在实现文本内容的自动提炼总结,以生成包含关键信息的语言描述。尽管现有主流的自动摘要方法在摘要任务中取得了较大
一直以来,风险管理始终是贯穿于银行经营发展中的一个重要话题。银行在经营过程中面临包括信用风险在内的各类风险,而信用风险是最为主要的一类风险。近年来,各家银行对信用风险的管理日益成熟,手段和方式日益多样化,风险管理也逐步从粗放向精细化的管理模式转变。而信用风险限额管理,作为信用风险管理中的一项重要手段,也越来越受到银行的重视。本文从信用风险及信用风险限额的基本概念入手,研究探讨相关的理论、银行业监管
任务型人机对话系统是指在垂直领域中能够帮助用户完成特定任务的对话系统,口语理解作为任务型人机对话系统的组成模块,主要的作用是将非结构化的自然语言文本转换为机器能够理解的结构化信息。准确理解用户对话中的语义信息是帮助用户完成任务的基础,因此口语理解的好坏直接影响对话系统的性能。口语理解主要包含意图识别与槽填充两个子任务,意图识别用于捕捉用户的意图;槽填充任务用来抽取用户传递的重要信息。近年来,基于深
从全球发展的历程来看,经济是国家之本。纵观我国工业进程的快速推进和高新技术的腾飞,经济和环境一体化趋势逐渐明朗,生态安全和环境问题逐渐被暴露。随着石油等不可再生资源的日益减少,汽车作为现代人生活的不可或缺的交通工具,同时在“十四五规划”纲要中明确指出对绿色生态环境的远景目标,新能源汽车产业作为我国战略性的新兴产业之一,其发展必然离不开科技创新的驱动。在历经11年政府大幅补贴的市场培育过程后,选择新
近年来,国内外经济环境日益变化,中国的银行业金融机构迎来了前所未有的巨大挑战,商业银行特别是中小型的城市商业银行的生存空间日益狭窄,如何及时转变经营思路、找准发展方向、实现精细化管理和差异化竞争是中小商业银行在经营管理中需要尽快解决的问题。全面预算管理和内部资金转移定价(以下简称FTP)是国内外商业银行广泛使用的两种管理工具。全面预算管理作为一种行之有效的战略管理和实施工具,可以有效推动各项经营生
村镇银行是我国农村金融机构改革发展的一大尝试和创新,自2007年全国首家村镇银行——四川仪陇惠民村镇银行成立以来,村镇银行在践行国家乡村振兴战略,助推脱贫攻坚,普惠农村金融市场等方面逐渐发挥了重要作用。在农村信贷业务发展方面,村镇银行将市场定位在服务“三农”“支农支小”,用其特有的、适合农村市场的信贷技术以及决策半径短、审批流程快的信贷服务优势,逐渐在农村金融市场占有一席之地,其“小而美”和“小而
我国《公司法》第142条2018年10月修订后,以上市公司回购股份定价区间为切入点,对回购股份进行研究,不仅在理论层面有创新意义,也在实践层面有指导意义,从打造资本市场良好生态的层面,更有着重要的全局意义。本文以上市公司回购股份为大背景,从回购股份定价区间切入,研究以下两个问题:第一,回购股份是否总是传递上市公司股价被低估的信号?第二,上市公司回购股份的定价区间,受到哪些因素的影响,这些因素的影响
研究表明,基于深度学习的命名实体识别模型的性能通常取决于训练数据的质量。在某些特定的领域,对数据进行标注通常需要标注人员具备一定该领域的相关知识,这极大地增加了标注数据的难度,所以在这些特定的领域可用于训练的标注数据相对来说比较少。为了快速获得训练数据,通常可以利用远程监督来自动标注数据,但由于词典等知识库的覆盖范围有限,远程监督产生的数据中通常包含较多的噪声数据。此外,即使是人工标注的数据集,由
试题知识点标注是指标注试题中用到的知识点的过程。在智能化教育背景下,智能题库的构建是智能化教育的基础,智能题库的构建离不开试题知识点标注。但现有试题知识点自动标注模型存在标签空间稀疏和数据集标签样本分布不均衡的问题,导致当前试题知识点自动标注模型的准确度还不够高,模型的鲁棒性还不够强。因此,研究基于深度学习的试题知识点自动标注模型,使其能够准确地标注试题中运用的知识点,进而应用到实际的智能化教育场
目的 “培土生金”法是从脾胃治肺的代表法之一,观察芪麦二陈汤治疗儿童感染后咳嗽肺脾气虚型的疗效。方法 将64例辨证为肺脾气虚型感染后咳嗽患儿进行分组,治疗组33例采用芪麦二陈汤加减口服治疗1周,对照组31例采用孟鲁司特钠咀嚼片口服治疗1周,观察2组治疗后疗效、主要症状、次要症状和中医证候积分改善情况。结果 治疗组总有效率高于对照组,差异有统计学意义(P<0.05);治疗组中医证候积分均优于对照组(