【摘 要】
:
随着信息行业的发展,数据已经渗透到各行各业生产经营环节中,数据量随之越来越庞大。但同时“数据丰富,信息匮乏”现象也变得越来越突出,造成这种现象的主要原因:一方面是现
论文部分内容阅读
随着信息行业的发展,数据已经渗透到各行各业生产经营环节中,数据量随之越来越庞大。但同时“数据丰富,信息匮乏”现象也变得越来越突出,造成这种现象的主要原因:一方面是现在并没有强有力的数据集成及数据分析技术,另一方面是随着脏数据的出现,严重的影响了数据质量,导致各行业不能有效的利用现有的数据。数据质量是数据分析、挖掘、决策的前提和基础。数据质量的提高,不但可以准确的反映现实世界的状况,同时也可以高效地支持企业的运作和决策。因此数据质量问题成为数据管理领域研究的一个热点问题。数据质量管理的方式主要是采用数据质量校验规则来判断数据合法性以及评估数据质量等级。数据质量校验规则与业务领域紧密关联,目前数据质量校验规则通常依靠领域专家和数据管理专家采用手工方式制定。手工制定规则工作量大,效率低、耗时长,且规则完整性难以保证。因此本文采用软件工程中“逆向工程”思想,借助机器学习相关技术,研究数据质量校验规则自动生成技术,可以为领域专家提供更多的规则备选方案,提高数据质量校验规则制定效率。为了全方面的检查出数据库中的所有质量问题,本文研究了数据质量维度评估标准,并以规则约束为研究点,针对Oracle和Excel数据源的文本数据格式、值域以及函数依赖关系展开研究,设计三种数据质量校验规则提取的学习算法的,研发具有较高通用性,且不受领域限制的数据质量校验规则提取系统。
其他文献
SMT生产线中的大多数加工设备均为数控设备。它们编程所需要的大多数特征数据均可从电路板设计系统中得到。如何在电路板设计系统和SMT自动化加工设备之间建立起有机的联系和
花鸟画是闲适类的欣赏画种,在人们的审美要求中,常似轻音乐一般的养眼舒心,所以画花鸟画常以散淡之心神趋之,不作有意的准备,握笔徐来,挥之渐速,以眼观纸,以心达意,故有笔到之处,神已转
综合装饰是以两种或两种以上装饰形式结合运用到同一件产品上,产生新的艺术效果的一种陶瓷装饰门类.它形式多,极富变化,艺术特色明显、感染力强,在陶瓷美术随着科学技术的发
近些年来,以微信、微博、QQ为代表的社交媒体蓬勃发展,对社会发展产生了深刻影响。人们基于这些社交平台进行内容生产与交换。文章通过引入“镜中我”理论,从社交媒体中选取
<正>2015年浙江省教育厅在《关于深化义务教育课程改革的指导意见》中指出,拓展性课程是指学校提供给学生自主选择的学习内容,明确要求,各地和学校要积极探索拓展课程的开发
网络群体性事件中,社会舆论聚焦于网络,人们围绕某主题或事件发表各自的意见和看法,这些具有相同声音或一致目的的公众便聚集成若干规模不等的群体。他们凭借互联网的优势加
在印制电路板生产过程中,树脂塞孔的孔铜因客户有相应要求,往往是先经过一次板电后,再经镀孔流程满足客户要求。主要通过实验,探究此类树脂塞孔板一次全板镀孔到客户要求树脂
近年来,古装剧持续火热,但与古装武侠剧、古装奇幻剧、古装传奇剧相比,同为古装剧的重大历史题材正剧,却因审查极其严格、创作难度极大、观剧门槛较高等原因,导致作品凤毛麟
本文从农民工的内涵及对经济发展、现代化的作用入手,运用时间序列数据,建立CobbDouglas生产函数模型,计量分析农民工对经济增长贡献。同时,并在此基础上,开展全省农民工问卷