论文部分内容阅读
【摘 要】随着互联网+时代的到来,人们日常生产生活产生了更加庞大的数据集合。这些数据的诞生也产生了一些新的高新技术——这也是当下最炙手可热的大数据技术;而在社区管理中应用大数据技术,更能精准、高效的满足当下诸如老年、残障人士的康复需求以及减少社区工作者的一些繁琐工作。本文将以此为论述背景,以一些具体的实例来阐述大数据技术在社区管理中的应用。
【关键词】大数据技术;社区管理;多元线性回归;数据可视化
一、大数据技术的概念
大数据技术是指那些超过传统数据库系统处理能力的数据。它对于数据的整体数量和转输的速度要求比较严格,或者其结构不适合原本的数据库系统。
对于社区工作者和相关企业来说,大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能揭示隐藏其中的信息。并通过提取的这些信息来制定出未来的一些规划安排。
二、大数据技术在社区管理中的应用
首先通过有关人员在社区中进行走访记录所需要的数据,回访结束后第一时间将数据录入数据库中进行保存。之后便进行对数据的初步清洗,剔除无关或是缺失数据。然后再将清洗之后的数据进行一个初步的整理分析,最后通过相应的可视化软件将最后的数据分析结果通过图像直观的展现出来,便于后续的分析当前的一些数据结果以及预测未来的变化。
三、具体应用案例(某区域所有老年人主要支出的数据预测)
通过选取了某社区内近一年小区老人主要开支的几个项目如疾病支出、护工支出、保健品支出、日常生活支出、其他支出这五项,通过建立合理的数学模型来预测出未来一段时间该社区老年人主要支出的一个大的方向来针对于老年人群体制定一个合理的计划来减小老年人的不必要开支,减轻老年人的生活负担。
如下表某区域内社区老人近一年的开支(节选):
四、分析的步骤及结果
通过分析F值,分析其是否可以显著地拒绝总体回归系数为0的原假设(p<0.01或者0.05),若呈显著性,表明之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析
通过R?值分析模型拟合情况,同时对VIF值进行分析,若模型呈现共线性(VIF小于10或者5,严格为10),建议使用岭回归或者逐步回归。
分析X的显著性;如果呈现出显著性(p值小于0.05,严格则需小于0.01);用于探究X对Y的影响关系结合回归系数B值对比分析X对Y的影响程度确定得到模型公式。
回归效果如下表格:
上表格展示了本次模型的分析结果,包括模型的标准化系数、t值、VIF值、R?、调整R?等,用于模型的检验,并分析模型的公式。
1.线性回归模型要求总体回归系数不为0,即变量之间存在回归关系。根据F检验结果对模型进行检验
2.R?代表曲线回归的拟合程度,越接近1效果越好
3.VIF值代表多重共线性严重程度,用于检验模型是否呈现共线性,即解释变量间存在高度相关的关系(VIF应小于10或者5,严格为5)
从F检验的结果分析可以得到,显著性P值为0.000***,水平上呈现显著性,拒绝了回归系数为0的原假设,同时模型的拟合优度R?为0.926,模型表现比较优秀,因此模型基本满足要求。对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题,模型构建良好。
模型的公式如下:
y=-900559.158+22.016 * 疾病支出+132151.431 * 保健品支出+17.080 * 日常支出-263.564 * 其他-176707.479 * 护工支出
从这个模型的公式中我们不难发现在老年人支出费用中占比最大的是护工和保健品的支出。
针对于上述为了更直观的看到模型的效果,需要对模型进行拟合,拟合最终效果如下图:
从上图我们能很直观的看出所建立模型的预测值与真实值相差不大,这也从侧面的反映出我们模型建立的合理性。
通过上述模型公式我们不难推断出未来一段时间内社区老人的主要开支情况,并及时的制定相关计划对社区内的老人进行帮扶。
五、前景展望
社区管理面对的是是一个庞大的居民群体,其中不乏一些特殊群体诸如老年、残障群体,这一部分群体的生产生活的需求往往可能被人们所忽视,但通过大数据技术,我们能更好地搜集分析并制定相應的方案,来满足这一群体的需求从而构建一个和谐美好的社区。
机遇和优势往往远大于我们所要面临的问题,通过此技术我们能摆脱传统上一些比较落后的社区管理手段,对于一些社区问题我们能用更科学、高效的手段进行解决,同时,通过大数据技术我们能更清楚地了解社区的实时动向,并及时的根据所辖社区内的一些数据动向制定合理的方案来满足居民所需。
参考文献:
[1]郭强,郭耀煌,向必灯. 我国社区管理模式适应性研究[J]. 软科学,2006(01):65-68.
[2]张锋军. 大数据技术研究综述[J]. 通信技术,2014(11):1240-1248.
(作者单位:西南科技大学城市学院)
【关键词】大数据技术;社区管理;多元线性回归;数据可视化
一、大数据技术的概念
大数据技术是指那些超过传统数据库系统处理能力的数据。它对于数据的整体数量和转输的速度要求比较严格,或者其结构不适合原本的数据库系统。
对于社区工作者和相关企业来说,大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能揭示隐藏其中的信息。并通过提取的这些信息来制定出未来的一些规划安排。
二、大数据技术在社区管理中的应用
首先通过有关人员在社区中进行走访记录所需要的数据,回访结束后第一时间将数据录入数据库中进行保存。之后便进行对数据的初步清洗,剔除无关或是缺失数据。然后再将清洗之后的数据进行一个初步的整理分析,最后通过相应的可视化软件将最后的数据分析结果通过图像直观的展现出来,便于后续的分析当前的一些数据结果以及预测未来的变化。
三、具体应用案例(某区域所有老年人主要支出的数据预测)
通过选取了某社区内近一年小区老人主要开支的几个项目如疾病支出、护工支出、保健品支出、日常生活支出、其他支出这五项,通过建立合理的数学模型来预测出未来一段时间该社区老年人主要支出的一个大的方向来针对于老年人群体制定一个合理的计划来减小老年人的不必要开支,减轻老年人的生活负担。
如下表某区域内社区老人近一年的开支(节选):
四、分析的步骤及结果
通过分析F值,分析其是否可以显著地拒绝总体回归系数为0的原假设(p<0.01或者0.05),若呈显著性,表明之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析
通过R?值分析模型拟合情况,同时对VIF值进行分析,若模型呈现共线性(VIF小于10或者5,严格为10),建议使用岭回归或者逐步回归。
分析X的显著性;如果呈现出显著性(p值小于0.05,严格则需小于0.01);用于探究X对Y的影响关系结合回归系数B值对比分析X对Y的影响程度确定得到模型公式。
回归效果如下表格:
上表格展示了本次模型的分析结果,包括模型的标准化系数、t值、VIF值、R?、调整R?等,用于模型的检验,并分析模型的公式。
1.线性回归模型要求总体回归系数不为0,即变量之间存在回归关系。根据F检验结果对模型进行检验
2.R?代表曲线回归的拟合程度,越接近1效果越好
3.VIF值代表多重共线性严重程度,用于检验模型是否呈现共线性,即解释变量间存在高度相关的关系(VIF应小于10或者5,严格为5)
从F检验的结果分析可以得到,显著性P值为0.000***,水平上呈现显著性,拒绝了回归系数为0的原假设,同时模型的拟合优度R?为0.926,模型表现比较优秀,因此模型基本满足要求。对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题,模型构建良好。
模型的公式如下:
y=-900559.158+22.016 * 疾病支出+132151.431 * 保健品支出+17.080 * 日常支出-263.564 * 其他-176707.479 * 护工支出
从这个模型的公式中我们不难发现在老年人支出费用中占比最大的是护工和保健品的支出。
针对于上述为了更直观的看到模型的效果,需要对模型进行拟合,拟合最终效果如下图:
从上图我们能很直观的看出所建立模型的预测值与真实值相差不大,这也从侧面的反映出我们模型建立的合理性。
通过上述模型公式我们不难推断出未来一段时间内社区老人的主要开支情况,并及时的制定相关计划对社区内的老人进行帮扶。
五、前景展望
社区管理面对的是是一个庞大的居民群体,其中不乏一些特殊群体诸如老年、残障群体,这一部分群体的生产生活的需求往往可能被人们所忽视,但通过大数据技术,我们能更好地搜集分析并制定相應的方案,来满足这一群体的需求从而构建一个和谐美好的社区。
机遇和优势往往远大于我们所要面临的问题,通过此技术我们能摆脱传统上一些比较落后的社区管理手段,对于一些社区问题我们能用更科学、高效的手段进行解决,同时,通过大数据技术我们能更清楚地了解社区的实时动向,并及时的根据所辖社区内的一些数据动向制定合理的方案来满足居民所需。
参考文献:
[1]郭强,郭耀煌,向必灯. 我国社区管理模式适应性研究[J]. 软科学,2006(01):65-68.
[2]张锋军. 大数据技术研究综述[J]. 通信技术,2014(11):1240-1248.
(作者单位:西南科技大学城市学院)