基于面板数据的聚类方法及应用研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:chaowei619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面板数据(panel data)是指若干样本在不同时点上的一个或多个指标观测值构成的数据集,也就是同时包含了截面数据和时间序列数据特征的一种多维数据。面板数据由于其特殊的数据结构,能够充分利用不同时点上各个指标的数据信息,有利于研究者从多角度、多时段掌握更全面的样本信息。大数据时代的到来和学科间的交叉渗透使得面板数据的聚类分析在各学科研究中的应用日益增加,由于经典的聚类方法难以直接应用于面板数据的聚类分析,这方面的研究仍有待深入。本文根据已有研究成果,针对面板数据的特征,对其聚类方法进行了改进与应用研究,总的来说,本文的研究内容包括:(1)在对已有面板数据聚类方法进行总结的基础上,分析了多指标面板数据的矩阵表示形式和时间序列特征,研究了将欧式距离直接应用于面板数据聚类分析时的不足;定义了面板数据的基本统计量,给出了面板数据的标准化处理公式;(2)提出了多指标面板数据的特征提取方法,定义了包括“绝对量”特征、“波动”特征、“偏度”特征、“峰度”特征及“趋势”特征在内的特征值统计量,以这些统计量为基础,衡量了面板数据的聚类对象在指标值、发展趋势、波动程度、分布情况等方面的相似性;(3)将K均值算法与本文定义的特征统计量相结合,构建了基于特征提取的面板数据聚类分析模型,并给出了聚类算法的详细步骤;从类内与类间距离,聚类域内样本距离的标准差两个角度出发,定义了面板数据聚类结果的评价方法;(4)利用本文提出的多指标面板数据聚类模型对全国各省2004年至2013年的交通安全状况进行了聚类分析,最终将31个省划分为5类,分析了每一类地区的特点及指标的演变情况,从主动预防、被动防御、区域合作等角度出发,提出了针对各省份的交通安全改善建议,为国家交通治理及发展规划提供参考。
其他文献
能源已成为国内经济社会发展的约束,“碳排放”已成为国际社会施压中国的砝码。占国内总能源消耗约六分之一的钢铁行业义不容辞地成为节能减排的排头兵。相对于技术节能,钢铁
随着我国社会的发展,科技水平也有所提高,电子技术也被广泛应用于各个领域。其中在电气工程方面的技术应用较为突出,电子技术的应用在很大程度上对电气工程的发展起到促进作用,顺
路基作为公路施工的主要结构层,膨胀土无法直接作为路基填料,应采取科学有效的措施进行处理,才能满足路基强度、稳定性需求及路基使用性能。目前公路路基施工中石灰改良膨胀土工
随着我国经济的快速发展,人们的生活质量得到了很大的改善,相应的需求也在不断的增加,为了更好的满足人们的需求,近年来我国各类工程项目都在积极的进行建设,建筑工程就是其中的一
在《电子技术》课堂教学中,要取得较好的教学效果,就要加强直观性和实物演示,运用比喻和对比法,创设问题情景,注重理论联系实际,激发学员的学习兴趣,提高其学习积极性。
机电一体化技术是在传统技术的基础上得到创新,将多领域技术进行融合的最新技术,在现代工业发展中起着着十分关键的作用。机电一体化系统凭借其先进的理念与技术应用范围非常的
在经济全球化的今天,知识更新速度非常快,知识已成为企业获得持续竞争优势的重要来源。要保持集群企业创新的活力,就要依靠知识创新的推动,通过不断更新知识等基础资源,及时
在现有的城市市政项目中,给水以及排水工程建设工作需要消耗的时间比较长,除了完成基础的通水管道拼装工作之外,施工者还要做好衔接给水以及排水系统的工作,管道施工属于地下施工
随着国家经济实力的提升以及社会的发展,大量建筑工程出现在了人们的生活中,不仅为国家建设与规划提供了不小的帮助,还在一定程度上改善了人们的生存环境质量。由于建筑工程施工
知识经济背景下,知识是企业的核心资源,组织间知识转移是企业提升创新能力和竞争力的重要途径之一。近年来,大量的研究表明,地理与文化上的接近性为企业间知识转移创造了便利条件,产业集群中组织间知识转移已成为产业聚集与知识管理研究中的一个热点问题。本文引入网络动力学的理论与方法,在分析集群网络及企业特征的基础上,构建企业间知识转移的理论模型和数学模型,并运用计算机软件对相关转移的机理进行仿真模拟,力求揭示