【摘 要】
:
提出了一种低秩矩阵补全的改进方法以研究道路交通量数据缺失值插补问题。应用基于核范数的低秩矩阵补全对交通量数据矩阵中的缺失值进行第1轮插补;通过层次聚类算法将交通量
【机 构】
:
江苏大学汽车与交通工程学院; 南京邮电大学江苏省大数据安全与智能处理重点实验室; 奇瑞汽车股份有限公司;
【基金项目】
:
国家自然科学基金项目(61773184,51875255,61572241);江苏省大数据安全与智能处理重点实验室开放课题(BDSIP1802)
论文部分内容阅读
提出了一种低秩矩阵补全的改进方法以研究道路交通量数据缺失值插补问题。应用基于核范数的低秩矩阵补全对交通量数据矩阵中的缺失值进行第1轮插补;通过层次聚类算法将交通量数据划分为不同类别,使得同类中的数据具有较强相关性,异类中的数据具有较弱的相关性;在每类样本上应用低秩矩阵补全得到缺失值的第2轮插补;为了减少聚类数的影响,提出最小二乘回归集成学习方法将不同聚类数下的插补结果进行融合,得到最终的交通量数据插补结果;用美国俄勒冈州波特兰市的交通量数据比较了5种方法的插补误差,并分析了不同聚类数和距离度量方法的影响。研究结果表明:在完全随机缺失模式下,缺失率为10%~60%时,其相对于传统的低秩矩阵补全模型的插补误差降低了5.93%~9.11%;在随机缺失和混合缺失模式下,插补误差也分别降低了8.32%~9.55%和8.14%~9.20%;集成不同聚类数下的多个插补结果比单一聚类数下的插补误差降低2.62%~4.76%。可见,在3种数据缺失模式下,改进低秩矩阵补全方法降低了交通量数据的插补误差,能有效提高插补后交通量数据的有效性。
其他文献
登革热(dengue fever,DF)是一种主要在热带、亚热带地区流行的蚊媒传染疾病,近年来疫情愈发严重。登革病毒(dengue virus,DENV)非结构蛋白(non-structural protein,NS)NS5是
随着社会对人才需求的不断发展,机关事业单位也在从原本人们意识中的“铁饭碗”向企业化管理转变,其在职人员的继续教育问题也越来越得到人们的重视。文章通过对当前机关事业单
预防性公路养护技术的应用与推广在我国具有重要的现实意义,可有效减缓公路养护压力。文章对其技术应用重点及未来发展趋势进行研究探讨,为推动预防性公路养护技术的作用发挥
以“波特—邓宁的钻石模型”为分析框架,从生产要素、需求条件、相关及支持性产业和企业结构、战略与同业竞争4个方面分析外商直接投资对人造板产业国际竞争力的作用机制;然
<正>本刊讯:据《第一财经》报道,贵州茅台截至2019年10月31日,共完成出口茅台酒及系列酒1576.82吨,销售金额3.69亿美元(人民币约为25.83亿元)。新增1家试销商和10家海外专卖
在翻译过程中,译者主体性的受动性是指译者在发挥主体性的同时还会受到文本、社会环境和主体三个方面的影响和限制。本文以2015年中国政府工作报告的汉英翻译为例,详细分析译者
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
光谱串扰校正是四色荧光DNA测序数据处理中的重要组成部分,它解决四色荧光浓度到四种染料浓度的转换问题。重点介绍了解决光谱串扰的基本转换模型以及估算转换矩阵的三种算法,
在进入信息化时代后,医院影像档案也要实现信息化的管理,其包括影像图像、检查报告、患者信息等方面的内容。与传统管理模式相比,将现代信息技术应用到医院影像档案管理工作
随着社会经济时代的不断发展,网络信息正在以前所未有的速度进行爆炸式增长,小学生使用网络,不仅是网络时代发展的要求,也是网络时代发展的必然结果.网络时代的发展为小学生