【摘 要】
:
随着信息技术的飞速发展,管理人员进行决策分析时对数据的依赖性越来越强。数据仓库频繁地从各种源数据中装载和刷新,这就要求数据进入数据仓库之前必须进行清洗。本文首先阐
论文部分内容阅读
随着信息技术的飞速发展,管理人员进行决策分析时对数据的依赖性越来越强。数据仓库频繁地从各种源数据中装载和刷新,这就要求数据进入数据仓库之前必须进行清洗。本文首先阐述了数据清洗的基本知识、研究意义和国内外研究现状。分析了数据清洗技术的原理、方法、评价标准及基本流程。在此基础上,对于数据清洗中缺失值的填充使用了以前未用于其中的基于密度的DBSCAN算法并进行了算法的改进,在公测数据集上进行了实验,并且与其他填充方法进行了实验对比,结果显示准确度较以往方法有所提高。最后对数据仓库中近似重复记录问题,改进了清洗算法,进行了实验验证,最终取得了良好的效果。
其他文献
目的:建立BALB/c小鼠U14宫颈癌移植瘤模型,观察肿瘤生长情况,探讨mBD2对小鼠机体免疫功能的影响。方法:采用无内毒素质粒大抽试剂盒抽提pcDNA3.1(+)/mBD2、pcDNA3.1(+)/rmBD2
为了能够在当今高度竞争的商业环境中生存和发展,企业需要不断改进自身的业务流程。显然,对业务流程进行动态建模可以大大提高项目重新设计的成功可能。本文对利用ARIS进行业务
随着计算机和网络的普及,信息服务被广泛重视并大力开发,从而使人类获取、发布和共享信息的途径产生革命性的变化。本文以吉林市高新区为研究背景,通过搭建信息服务平台,来研
随着越来越多的重要数据存储在磁盘上,磁盘数据的安全保护逐渐成为备受关注的议题。众多的安全威胁如磁盘数据被非法修改、磁盘数据泄漏、磁盘失窃,都可能会对保存着重要信息
社区在我国社会发展和建设中起着重要的作用,社区和谐是社会和谐的基础,为社区居民提供高质量、多样化的服务是促进社区繁荣稳定、提高人们生活质量的重要手段。社区建设一直
数据库移植,就是不改变原有系统的后台数据库管理系统,并仍然保持原有系统架构、系统数据,前后端应用程序不变的一种系统升级方法。这种系统的变更通常是出去商业或者系统整
随着城市化进度的加快,城市公共聚集场所中的事故隐患有明显上升趋势。城市公共场所,一旦出现重大事故,往往会造成人员伤亡以及财产的严重损失。这些事故具有群发性、密集性
深基坑工程是当前岩土工程领域的热点和难点问题之一。如何有效控制基坑变形,使基坑工程既安全又经济,是人们一直探索的课题。深基坑支护结构的变形是影响基坑变形的重要因素
为了解决高速公路收费站通行能力和收费站规模之间的矛盾,近年来高速公路管理部门正在逐步推广ETC收费方式。但对于引入ETC收费方式过程中涉及到的不同收费系统改造方案,所造
近年来,以甲醛等为代表的室内空气的污染问题引起了人们越来越多的关注。等离子体催化是实现等离子体化学反应过程低能耗、高脱除率的一条有效途径。本论文先用催化剂吸附富集