【摘 要】
:
张量是高维数据的自然存储形式,它能够有效的保留原始的数据结构,使用张量进行数据挖掘工作,结果具有更高的准确度。张量是深度学习领域的基本数据结构,同时也是构建关系数据模型的主要工具。关系模型是目前比较热门的研究领域,亦是知识图谱、推荐算法等应用方向的基础。本文将张量分解应用到关系模型领域。在关系模型中,Rescal分解是一种插补准确度高,且比CP分解更具解释性的分解算法。过去研究的关系通常是0-1的
论文部分内容阅读
张量是高维数据的自然存储形式,它能够有效的保留原始的数据结构,使用张量进行数据挖掘工作,结果具有更高的准确度。张量是深度学习领域的基本数据结构,同时也是构建关系数据模型的主要工具。关系模型是目前比较热门的研究领域,亦是知识图谱、推荐算法等应用方向的基础。本文将张量分解应用到关系模型领域。在关系模型中,Rescal分解是一种插补准确度高,且比CP分解更具解释性的分解算法。过去研究的关系通常是0-1的二元关系,而本文提出了一种基于广义关系(离散的、连续的)的Rescal分解,使用交替最小二乘算法进行迭代拟合。生成了仿真数据,从秩的选择、初始化方法和原始Rescal三个方面进行了对比,研究发现,广义损失函数的拟合效果与二次损失函数的拟合效果整体相当,但从可解释角度来看,广义方法更贴合数据的实际特征。最后,本文将提出的广义分解方法,简单应用到了股票市场。希望通过股票之间关系来填充由于股票停牌而无法计算的对数收益率相关系数。结果表明了填充方式的合理可行性,结果也与实际情况相符合,但由于样本数据量小,填充结果的精度不一定高,可能存在浮动区间。基于缺失相关系数的结果,可用于一些金融模型,帮助投资者做出投资决策或者投资组合选择等。
其他文献
在时间序列预测领域中,空气质量预测是其中一个重点研究方向,近几年里,传统的机器学习模型以及方法在空气质量预测方向被越来越多的使用。由于空气质量指数存在着数据短期规律性差的特点,易受多方面因素综合影响,因此难以进行精准预测。在本文中,我们可以通过光谱时间图神经网络(Stem GNN)来提高对多元时间序列估计的精确度。Stem GNN可以在光谱域共同捕获时间序列间的相关性(本文中为35个空气监测站点的
履带式救援机器人具有牵引力大、不易打滑、越野性能好等优点,基于先进推进系统的机动性能是救援机器人完成救援工作的决定性因素。以推进系统为研究对象,设计了履带式救援机器人推进系统总体方案及行动系统、动力系统等关键子系统方案,解决了参数设计、部件选型、优化布置等关键问题,为危险和复杂灾难环境下的救援装备提供了一种高集成度技术实现途径,具有良好的工程应用价值。
会计师事务所要满足时代发展的需要,应该把控好财务审计风险控制工作,依据实际需求采取有力的控制措施,利用合理的方式规避风险,将各项审计工作落实到位,确保财务审计的规范性和严谨性。基于此,首先分析财务审计风险的特点,其次提出加强财务审计风险控制的重要作用,最后提出控制的具体策略,以期为相关工作的开展提供参考意见。
以对-亚苯基-双苯偏三酸酯二酐和4,4′-二氨基二苯醚为单体,乙酸酐和三乙胺为化学亚胺化试剂,通过改变亚胺化试剂的含量制备了一系列聚酰亚胺(PI)薄膜,并对薄膜的微观结构及性能进行了研究。研究结果表明,随着亚胺化试剂添加量的增加,聚酰胺酸脱水生成PI的反应程度逐渐增大,在后续薄膜成形过程中更有利于溶剂脱除,但是对最终PI的一级化学结构并没有影响。然而,亚胺化试剂的加入提高了最终PI薄膜的结晶度,同
推广电动汽车的使用和发展是减少资源消耗和排放污染并走向可持续发展的有效途径。然而关于电动汽车动力电池系统的生产需消耗多种矿产资源与一次能源并且伴随着大量温室气体和其它污染物的生成,由此造成的资源和环境问题是锂离子电动汽车行业进一步发展的严重障碍。如今,中国是新能源电动汽车生产大国和使用大国,碳中和成为我国新能源汽车发展的重要目标,而关于动力电池相关的资源和环境评估体系却还在起步阶段,尚未完善。因此
土地是很重要的自然资源。吉林省作为我国重要的农业大省,合理利用开发土地,研究土地综合承载力,找出限制吉林省土地承载力发展的制约因素,可以为吉林省合理规划土地利用目标提供一定的决策依据。此外,本文打破了以往学者对土地综合承载力的单一研究,从多个角度更全面深入系统地分析了土地综合承载力。且以往学者对从时间和空间角度探究内生变量之间的动态影响研究较少,本文研究了土地综合承载力内生变量间的影响机制,可以拓
产能利用率是衡量企业生产时资源利用效率程度的名词。若产能利用率不足就会造成产能过剩的情况,产能过剩问题在我国工业生产中普遍存在,产能过剩既有一定的弊端,又有一定的优势:产能过剩会在一定程度上制约行业的快速发展,加重环境污染,但同时也能够加快淘汰落后产能,促进生产优化。根据以往文献的研究,产能利用率不足即产能过剩,是影响环境污染的重要因素。本文以吉林省汽车产业的产能利用率作为研究对象。吉林省的汽车产
随着互联网线上交易模式逐渐成熟化,高频股票交易在全球金融市场下快速发展,此时低频数据分析已无法充分地反映金融市场交易信息,因此高频金融数据分析成为了近年研究的热点方向。而对于高频交易数据,传统的时间序列分析方法面临着估计大量参数且估计效果不准确的难题。因此,学者们提出函数型时间序列分析方法,依据数据内部的特征结构,将数据整体看成曲线进行分析,有效避免了“维度灾难”。本文主要研究的高频交易数据来自限
股票市场是促进资本、科技、实体经济高水平流通的重要枢纽,股票市场中的价格通常被视为经济活动中最有信息效率的,公司管理层会利用股价中的信息进行决策进而提高生产效率。在国家强调高质量发展、重视全要素生产率的背景下,探究股价信息含量对企业全要素生产率的影响具有重要意义。本文利用股价非同步性衡量股价信息含量,运用OP法和LP法构建上市公司全要素生产率,以2004-2019年沪深A股上市公司的相关数据为样本
人工鱼群算法以水中鱼及鱼群的行为为研究对象,通过总结和分析它们的生物习性并通过数学模型描述起来的一种智能仿生优化算法,该算法有诸多优点,如对初始解不敏感,鲁棒性较好,容易逃离局部最优等,受到广泛的关注,并被应用到各个领域中,为解决当前高维,复杂,非线性的工程问题,提供了解决方案和思路。对人工鱼群的深入研究和进一步完善是当前优化领域的一项非常热门的课题。鱼群的觅食,群体聚集,跟随可以帮助鱼群快速定位