基于函数型数据的食品饮料类股票价格分析

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:cashcumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
民以食为天,食品饮料作为必须消费品的主要成分,一直以来以市场广阔、技术更新迭代慢、利润稳定等特点,在金融市场中颇受投资者的喜爱。我国金融市场虽然起步较晚,相比欧美等发达国家的金融市场还有较大差距,但随着我国改革开放和世界经济全球化发展,我国的金融业发展迅速。而且随着科技的发展,数据搜集变得越发容易了,我们可以轻易地提取股票市场的各种交易数据,这些数据具备大量、高频等特点,可以反映一个国家或地区的经济发展状况,是经济走势的重要风向标之一。近几年,研究与处理复杂数据已经逐渐成为一个新的研究热点,由于所得数据复杂且大量,基于各种统计推断的传统数据分析方法会具有一定的局限性,为此,学者们通过研究数据特点,提出函数型数据分析方法——将大量复杂数据处理为函数曲线进行研究,大大提高了数据的利用效率。本文研究的主要对象为函数型数据,使用的主要研究方法为函数型主成分分析法、基于函数型主成分分析的k-means聚类分析、时间序列模型ARIMA以及函数型主成分预测模型FPCP。本文从函数型数据的处理方法开始介绍,总结了常用的平滑方法的优缺点,并详细介绍了本文中所用的B-样条函数的基本方法;然后详细介绍了传统数据分析方法中主成分分析的主要思想和重要求解方法,并将之扩展到函数型数据分析方法中:利用Karhunen-Loeve法则正交展开求解特征函数和特征值并计算各主成分得分;之后基于函数型主成分分析结果,对研究对象进行聚类分析,将研究对象进行合理分类;最后利用时间序列模型和函数型主成分预测模型进行各类股票收盘价格的趋势预测。在实证方面,本文主要是基于2015-2020年食品饮料行业85只股票的收盘价格进行了详细分析,分别对原始数据和归一化后的收盘价数据进行了如下操作:通过采用B-样条基函数法将离散的数据转化为连续的函数型数据,并对处理后的数据进行函数型主成分分析、聚类分析,并根据分类结果进行相应的模型预测。根据函数型主成分分析结果,对于原始数据我们选取了满足累计贡献率高于95%的两个主成分进行后续分析,并结合近几年股票市场发展行情对各个主成分所反映的内容进行了合理的解释,便于读者理解结果,同时也为投资者制定合理的投资策略提供了参考资料;对于归一化数据我们选取了满足累计贡献率高于85%的三个主成分进行后续分析。在进行聚类分析时,仅依据满足累计贡献率要求的主成分所对应的载荷因子进行分析,最终在原始数据下将85支股票分为4类,在归一化数据下将85支股票分为2类,突破了行业标准的限制。在最后的预测模型中,我们分别对归一化后的收盘价和收益率这两类数据进行了模型拟合和预测:一方面我们利用时间序列模型对各类股票的均值函数大体趋势进行了预测;另一方面我们借助函数型主成分预测模型对单只股票的情况进行了预测,预测效果均符合预期。使用两类模型分别对板块价格趋势和个股价格趋势进行预测,进一步完善预测完整度,研究结果有利于帮助投资者预判市场行情,做出合理的投资决策。
其他文献
在金融市场中,波动率不仅是衡量风险的指标,它对衍生品定价和资产配置都至关重要,因而对于波动率的研究一直是金融研究领域当中的较为热门话题。在对波动率的研究上,一些学者采用了文本情感分析的方法,通过词频统计模型探究与波动率的关系。然而,词频统计模型因其无法联系上下语义的局限性,语义捕捉能力较差,降低对波动率的解释效力。此外,而在对波动率预测的研究上,之前的研究集中在对低频收益率数据拟合而成的GARCH
学位
在语言学的定义里,新词是指一个最近铸造的发明词或者词组,可能来源于新事物的产生、方言的吸收、简略词汇、外来语等。当今互联网时代下,大量的中文新词会在不同背景的碰撞下产生并借助网络的力量迅速传播开来。由于中文里没有明显的界限符,所以在英文中不存在的分词问题在中文里却是很重要的一步。未登录词是影响分词准确率的重要因素,新的未登录词及其变体层出不穷,依靠人力去构建词库费时费力,因而使用某些方法让计算机自
学位
在中央经济工作会议提出的“六稳”方针中,“稳金融”的底线是要求不发生系统性金融风险,并稳步推动金融市场的发展。商业银行作为核心金融机构,其信贷风险管理质量对金融市场的稳定有重大影响,特别是随着近年来中小企业的快速发展及其伴随而来的银行信贷资源需求与日俱增,中小企业的信贷风险管理逐渐成为商业银行信贷风险管理之重点。信贷风险评价体系作为商业银行信贷风险管理的基础性环节,直接关系到信贷风险管理质量。商业
学位
近年来,随着深度学习算法的效果变得越来越好,许多学者开始着眼于深度学习算法的稳定性。其中的一个方向叫对抗样本。对抗样本是指在原始数据上添加一个特定的噪声(噪声的比例越小越好,能被模型识别而不被人眼察觉)使得损失函数最大化,所形成的输入样本,会导致模型以大概率给出一个错误的结果。对抗样本的生成又被称为对抗攻击。现如今,深度神经网络已经成为了人们生活中不可或缺的一部分,人脸识别、语音转文字等都是日常生
学位
报纸
医疗搜索作为广大群众搜索场景下的刚需,是普通用户获取优秀医疗资源最为便捷的渠道。医药领域数据的爆发式增长给研究人员提供了丰富的知识,是重要的研究资源。医疗搜索的重点就是从海量庞杂的医药领域数据中快速高效地获取信息,而命名实体关系抽取就是文本数据处理工作中一项基础且重要的环节。在医药领域内,准确识别说明书中的禁忌症和适应症实体对于构建合理用药规则,构建完善的医药领域知识库有重要意义。但是,由于医药领
学位
多重检验是目前高维统计推断的领域中研究的热点之一,并在临床医学、基因检测、教育学等多领域中均有广泛的应用。同时对多个假设进行检验是多重检验的实质,它常常被用来对来自大量总体的某个参数或多个参数的水平进行比较。当多重检验中的一个假设被拒绝,我们通常希望对该参数构造置信区间,从而确定该假设对应真值的取值范围。我们将多重检验中被拒绝的假设对应的参数称为选择后参数,为选择后参数构造能控制FCR的置信区间也
学位
“碳标签”(Carbon Labelling)是一种将商品在生产、流通过程中排放的温室气体排放量,在产品标签上用量化指数标示出来的方法。全球已有11个国家正在积极建立“碳标签”制度。我国也已经形成了相关的团体标准和试点成果。“碳标签”的形成涉及产品生产、加工、流通过程中的多个环节,导致碳数据归集困难、真实性难以保障和易被篡改。为此,本文提出一种基于区块链和隐私计算技术,从供应链的视角构建“碳标签”
期刊
随着位置采集和移动通信技术的不断进步,每天有大量的轨迹数据被采集并收录,因此在过去的十数年中,轨迹数据挖掘工作进展迅速,而异常轨迹检测是其中很重要的一部分。目前中国的汽车保有量、销售量都位于世界前列,与此同时,国家重大专项中的车联网项目正在大力发展中,车辆轨迹数据是日常能接触到的最广泛、最普遍的轨迹数据之一。本文研究的问题是通过轨迹数据挖掘来进行轨迹异常检测,即使用一个地区车辆出租公司出租出去的车
学位
随着大数据时代的发展,尤其是深度学习的研究,使得人工智能产品逐渐进入人们的视野,而图像描述则是近年来一大研究热点,可应用于网络图片数量爆炸式增长背景下的图像检索,也可应用于自动驾驶技术中的交通标志描述,还可应用于医疗领域中视觉障碍人士的生活辅助等等。图像描述任务是一种融合了图像信息和文本信息的多模态任务,目的是使计算机自动生成一句对图片的文本描述,因此如何准确提取图像特征、生成可读性高且准确的文本
学位