【摘 要】
:
随着信息技术的高速发展,数据总量呈现出指数型增长的趋势.各个公司依托其强大的存储能力,不断地采集、整理和分析数据,希望从中挖掘出有价值的信息.大量数据存放于不同的数据站点或各种类型的服务器中.由于安全、隐私或其他技术原因的限制,各个公司不愿意分享本地数据从而无法在数据层面实现共享,因此只能在非数据层面进行信息交互.为了更好地利用不同层面的信息来探究本地数据站点的内部结构,基于协作机制的聚类算法应运
论文部分内容阅读
随着信息技术的高速发展,数据总量呈现出指数型增长的趋势.各个公司依托其强大的存储能力,不断地采集、整理和分析数据,希望从中挖掘出有价值的信息.大量数据存放于不同的数据站点或各种类型的服务器中.由于安全、隐私或其他技术原因的限制,各个公司不愿意分享本地数据从而无法在数据层面实现共享,因此只能在非数据层面进行信息交互.为了更好地利用不同层面的信息来探究本地数据站点的内部结构,基于协作机制的聚类算法应运而生.协作聚类的基本思想是首先在各个数据站点独立地运行聚类算法,然后通过交换每个数据站点的局部结构信息进行交互,从而揭示不同数据站点潜在的共同底层结构.其中证据聚类算法基于证据理论中信任划分的概念,拓展了传统硬划分、模糊划分和可能性划分算法,能够更好地了解数据的内在结构.本文在证据理论框架下,首次基于证据c-均值算法引入协作机制,提出了协作证据聚类的概念用于探究各个数据站点深层次的结构信息.首先,通过各数据站点簇结构信息中的信任划分矩阵建立证据理论框架下的协作机制,从而满足数据机密性要求.其次,考虑到存在信息交互过度和信息交互不充分性的问题,分别设计了单步协作和多步协作证据聚类算法,其中多步协作的次数由全局结构相似性指标有效地进行控制.接着,对于起到平衡本地数据信息和协作者结构信息的协作强度系数,为了便于用户自定义设置,我们给出簇间相似性和簇相对距离两个指标进行辅助指导.最后,为了证明协作证据聚类算法的有效性及各个指标的合理性,通过模拟数据集和UCI机器学习数据库中三个真实的数据集分别在全局水平上和局部水平上对协作效应进行了全面细致地考察.
其他文献
中医脉诊是传统中医药不可或缺的一部分,中医通过脉诊可以进行疾病诊断及预后。脉象信息可以反映人体五脏六腑的生理病理信息,而这种信息是由医生手指感觉及临床经验呈现出来
研究目的:探讨临床应用智能CO2激光辅助Fisch人工镫骨术治疗耳硬化的疗效及智能CO2激光用于镫骨足板开窗的安全性。同时设计动物实验采用小功率CO2激光小范围多次照射(传统CO2
随着旅游业的发展,中国已经成为世界上第三大的旅游大国。越来越多对中国文化感兴趣的外国游客来中国旅游,陪同译员对促进导游与游客之间的交流扮演重要的角色。因此,景点陪同口译应该进行深入研究。经一位在旅行社工作的朋友介绍,作者作为陪同口译员协同一位中国导游完成景区介绍工作。本篇报告基于目的论对滕王阁陪同口译进行总结。这篇报告可以分为四部分。第一章主要介绍了任务描述、人物特点以及本篇报告的研究目的和意义。
全球化进程的加快和科学技术的不断发展,导致了产品生命周期的日益缩短,市场竞争不断加剧。市场环境的变化给企业的发展提出了新的挑战,而此时产业创新联盟应运而生。作为一
一个组织的技术等级或能力在很大程度上取决于管理层获取信息以决定选择和作出明智决策的能力。由于这一变量对组织效能起着关键性作用,在研究中,着重对组织信息流情况进行了
目的:合成近红外量子点并验证其荧光成像和光动力效应。方法:应用一锅法水相合成近红外量子点CdTe,经表征检测后连接RGD多肽,再用激光共聚焦显微镜观察其荧光成像效果。随后,
神经胶质瘤(glioma)是中枢神经系统最常见的恶性肿瘤。目前胶质瘤的标准治疗方式是以手术切除为主,辅以放疗和化疗的综合治疗方案。尽管几十年来胶质瘤的治疗策略不断提高,但
随着智能地球和城市的持续发展,由于无线感知设备的不断大量部署,使感知数据跨越了爆炸性增长的新时代。无线传感器网络(Wireless Sensor Network,WSN)作为感知大数据的主要来源之一,广泛应用于智能交通、环境监测、工业生产等领域。然而,感知节点的能量非常有限,通常不能及时充电。同时,由于WSN的部署环境复杂,数据收集方案仍然面临安全威胁。传统的WSN已经不能满足海量数据的处理和管理
遥感图像分割是遥感图像信息分析处理与应用中最关键的技术之一,因为有效的分割结果可以给后续的遥感图像分析、识别等高级过程提供关键的信息。这些年来,国内外对遥感图像分
随着智能科技在人类日常生活中的应用越来越广泛,人脸识别技术的发展也越来越迅速。关于人脸属性研究的需求在安全监控侦查、人机交互、定向商业宣传和影视娱乐等方面也愈来