智能公交轨迹数据质量评估模型及实现

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 3次 | 上传用户:shinetar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2015年8月,国务院颁发的《促进大数据发展纲要》中大力鼓励推动大数据的发展和运用,明确了大数据给我们整个社会带来的飞速改变和巨大效益。随着每天数据量的增长,也进一步衍生出了数据交易市场。但是,目前数据交易市场缺乏完善的交易机制,导致数据交易价格不合理,很多企业频繁发生数据断交等事件。2017年9月,随着国家发改委及国资委的《公共交易平台数据规范》的颁布及实施,使得其成为了公共数据交易的技术标准,不仅打破了信息的壁垒,而且推动了数据的共享。面对大量的数据交易,交易双方必须有基本的交易参考标准,有规范的数据定价,而不是单一的依靠数据量的大小作为定价的标准。如此看来,研究数据的质量问题变成公平数据交易的首要问题,如果交易双方能够对数据的价值有基本的判断,那么将会降低数据交易的成本。因而,对交易的数据进行质量评估对规范数据交易市场、数据定价具有十分重要的指导意义。传统对数据质量评估方法是基于ISO9000系列标准提出一些数据评估的维度,或是研究某些数据质量特征。面对如今大量的数据应用,这种研究方法已经不能满足当下实质性的需求。我们每天生活出行都产生很多的轨迹数据,所以本文选择基于智能公交IC卡刷卡和公交GPS轨迹两类数据进行数据质量评估方法的研究,从数据接入到清洗,提出不同的指标算法对数据进行评估,每个指标都利用熵值法进行权重的计算,最后得出数据的质量评分,进而将数据的质量评估结果量化,得出比较直观的评估结果。为了对所提出的质量评估模型进行准确性的验证,本文分别计算OD客流量和准点到站率来对两类评估后的数据进行验证。经验证,数据评估得分为90~100分的数据集所算出的OD客流量和准点到站率达到真实值的95%以上,正确率明显提高了10%以上。而得分在70分及以下的数据集所算出的OD客流量和准点到站率只有真实值的60%左右。可以发现,本文所提出的质量评估模型对数据具有很好的评价效果,得分越高的数据有效提高了数据运用的正确率,也证明了本方法对数据的质量评估是非常有效的。为了将数据质量评估的结果更好的展示,本文进一步将评估过程一体化,将评估结果进行可视化的展现,这样更直观、形象的展现评估结果,将整个数据质量评估的过程和结果进行了很好的整合,真正方便、快速的实现对接入数据进行质量评估。
其他文献
本文提出了基于改进阈值小波及改进支持向量机的低速重载滚动轴承故障识别方法.首先在实验台上测量三种不同工况的轴承信号,利用改进阈值小波对信号进行降噪处理,将降噪的信
目前,中国已经进入了工业化发展的中期阶段,国民经济的增长主要依靠非农产业,农业已经从提供物质积累的产业部门转变为需要接受“补贴”的产业部门。但在刚性的财政预算约束
本文从全国各地的“大调解”格局的建立以及广泛报道说起,对“大调解”存在的状况和原因进行分析,分析马锡五审判方式对今日中国的影响,陕甘宁边区出现该审判方式是有其当时
新石器时代中晚期,安徽地区陶瓷窑业已进入有窑烧造的时期,是我国升焰窑的发源地之一。同时,安徽地区处于我国古代两大瓷窑体系的"分水岭",以淮河为分界线,其烧瓷窑炉结构及
自1949年以来,我国集体林权制度几经变革,在不断的探索中前行。自2008年6月开始,全国范围内开展了集体林权制度改革。在林改政策实施多年后,非常有必要了解当前政策的实施成
目的分析直肠癌患者手术配合应用循证护理的效果。方法抽取本院2016年4月至2018年3月收治的直肠癌患者236例,随机分组,对照组(118例;常规护理)和研究组(118例;循证护理),比较
工业化、信息化、新型城镇化和农业现代化同步推进、协调发展的国家战略下,国家主张在农业方面建立起新型农业经营体系,在坚持和完善以家庭承包经营为主体的农业经营制度基础
星基增强系统是一种广域增强系统,能够通过星座部分发送信号实现对全球卫星导航系统(GNSS)的增强效果。SDCM是由俄罗斯自主研发的星基增强系统,它可同时为GPS和GLONASS两个系
全球人口结构在21世纪进入了整体化的质变阶段,即人口老龄化时代已经到来。许多发达国家,在长期人口负增长时期后,进入了人口超老龄化阶段,其社会保障政策也转向了更关注老年
随着经济的发展和农业现代化水平的提高,越来越多的农村劳动力从单纯的农业生产中脱离出来从事非农业工作,形成农村劳动力的流动。在农村劳动力流动人口中,很多是子女尚处于