【摘 要】
:
现实中的数据往往分布在网络中的多个数据库中,传统的数据处理方法需要将数据进行集中才能进行有效处理,而这在实际问题中往往受到数据规模庞大、隐私保护等因素的限制。因此
论文部分内容阅读
现实中的数据往往分布在网络中的多个数据库中,传统的数据处理方法需要将数据进行集中才能进行有效处理,而这在实际问题中往往受到数据规模庞大、隐私保护等因素的限制。因此,如何在不进行数据集中的前提下对分布存储的数据进行有效地处理是当前数据挖掘中的一个热点问题。属性约简是数据挖掘中的一个重要研究内容,通过属性约简能够去除数据中冗余的或不重要的属性,加快后续数据处理过程。研究者们对集中式数据的属性约简进行了研究,并形成了比较完善的研究结果。以保持属性约简前后系统分类性能不变为前提,对于分布式符号型数据的属性约简问题,研究者已经提出了相应的理论和方法,但对于分布式连续值数据和分布式不完备数据的属性约简还有待研究。本文深入研究了分布式连续值数据和分布式不完备数据的属性约简问题,主要内容如下:1.研究了分布式连续值数据的属性约简。首先,给出了分布式连续值决策信息系统中邻域粗糙集的定义。然后,以保持分布式连续值决策信息系统的正域不变为前提,探讨了分布式连续值决策信息系统中属性的可约性,并提出了分布式连续值决策信息系统的属性约简算法。实验结果表明该算法能够有效去除分布式连续值数据中的冗余属性,使得约简后的分布式连续值数据的集成分类能力与约简前相差不大,甚至更高。2.研究了分布式不完备数据的属性约简。首先,基于容差关系和非对称相似关系给出了分布式不完备信息系统中粗糙集的定义。然后,以保持分布式不完备决策信息系统的正域不变为前提,探讨了分布式不完备决策信息系统中属性的可约性,并提出了分布式不完备决策信息系统的属性约简算法。实验结果表明该算法能够有效去除分布式不完备数据中的冗余属性,使得约简前后的分布式不完备数据的集成分类能力相差不大。并且,数据缺失率的改变对基于容差关系约简分布式不完备决策信息系统时产生的影响较大,对基于非对称相似关系约简时产生的影响较小。
其他文献
HEVC作为新一代视频压缩标准,在主流的混合编码框架基础上,引入了许多新的编码技术,从而极大的提高了视频编码效率,其压缩性能相比于目前普遍应用的H.264/AVC标准约提升了一
细粒沉积是近几年的研究热点,关于细粒沉积岩相及不同岩相形成的机制则一直是研究难点。为此,文章运用沉积学、岩石学、地球化学等理论和研究方法,在岩心精细描述的基础上,以渤海湾盆地济阳坳陷东营凹陷的樊页1井和牛页1井沙四上亚段为典型研究目标,以细粒沉积纹层为主要依据,开展了细粒沉积岩相的研究。1.通过岩心精细描述、岩石薄片和电镜观察分析,得出沙四上亚段细粒沉积岩石组成主要为灰质泥岩和泥质灰岩,还包含少量
目的:本研究旨在探讨重组人血小板生成素(rh TPO)对脂多糖(LPS)所致血小板减少症(TCP)小鼠成熟血小板的影响,为rh TPO在脓毒症血小板减少患者中的临床应用提供理论参考依据。内容:采用雄性SPF级C57BL/6小鼠,随机分为5组,分别为:(1)假手术组(Sham组);(2)实验对照组(LPS组);(3)低剂量组:LPS+rh TPO 1.35×103U/kg·d组(L组);(4)中剂量
作为太阳能的转化利用方式之一,光催化相比传统的加热反应,具有清洁环保、安全易控等优点,因此制备高催化活性的光催化剂成为当前研究的热点。本文采用水热法制备了WO_3纳米棒,在此基础上,分别通过共沉淀法和水热法制备了不同摩尔比例的Cu_2O-WO_3和WO_3-Ti O_2纳米复合半导体,研究了WO_3基半导体纳米材料的光催化性能。Cu_2O-WO_3复合半导体由立方体和不规则颗粒构成。紫外可见光测试
从我国的立法体制演变看,全国人大常委会从无立法权的状态,到可以制定单行法规,再到可以制定法律的历史过程,致使出现了“基本法律”与“非基本法律”的概念区分。“基本法律
目的:本研究为了调查分析活动性肺结核患者人体成分特点和肌肉减少症的患病率,探讨活动性肺结核肌肉减少症的相关因素,为提供合理化支持治疗及健康指导提供依据。方法:本研究纳入2017年1月25日至2018年1月25日于天津市海河医院住院的活动性肺结核103例,同时纳入同时期健康体检者53例作为对照组。对两组纳入者均进行一般资料的调查(性别、年龄、既往合并疾患),人体基本情况测量(身高、体重、握力),人体
研究目的:本研究旨在针对慢性心力衰竭心肾阳虚证这一关键人群,采用温阳利水益气的方剂—济生肾气丸合五苓散方组方,通过观察患者治疗前后中医证候、心功能等级以及NT-pro BNP等指标的改善情况,以明确临床疗效。研究方法:选取就诊于山东中医药大学附属医院心内一科,且符合入组标准的住院患者60例,分为治疗组和对照组两组。两组患者均常规给予基础治疗及西医规范化治疗。治疗组患者在基础治疗及西医规范化治疗的同
路由协议是无线传感器网络研究的关键技术之一,能够有效地减少数据传输阶段的能量损耗。在目前路由协议的研究中,层次型节能路由算法具有较高的能量利用效率和网络健壮性,在
近几年来,知识库已吸引了学术界和工业界的大量关注。众所周知,像Freebase和DBpedia这样的大型知识库已经成为支持无限定域问答系统的重要语义数据库。然而当用户需要查询这
可编程、虚拟化作为5G无线网络中的关键技术可以和已有的SDN和NFV技术结合,对网络资源以及基础设备资源进行抽象和统一,提高网络资源利用率,简化网络的复杂度,已成为软件定义