基于特征加权的分布式大数据相关性挖掘方法

来源 :计算机仿真 | 被引量 : 1次 | 上传用户:auiadufzxyw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统方法存在计算时间较长,任务分配均匀程度较差的问题,提出基于特征加权的分布式大数据相关性挖掘方法。对软子空间进行聚类,根据特征加权的不确定性表示加权聚类中心,并求解权值。设计特征选择的技术框架对特征加权进行选择,依据特征空间搜索机制完成特征筛选。根据特征筛选结果运用MapReduce编程模型对数据簇的聚类中心进行反复扫描,计算样本到聚类中心的距离,去除其中的孤立点。利用Shuffle均衡分组机制计算频繁项集,开始新项的FP树建立及频繁项集挖掘,直至完成所有频繁项集的挖掘。实验结果表明,所提方法
其他文献
针对鲸鱼优化算法个体之间信息交互少,易陷入局部最优的缺点,引入社交学习理论,提出了社交学习鲸鱼优化算法。首先根据个体适应度值及维度设定个体的学习概率上限,然后分别在算法勘探和开发阶段完成参考鲸鱼的筛选及待学习个体向群体均值个体学习。对比其它四种算法在22个基准函数及7次偏移后的Sphere, RosenBrock, Griewank函数上单独运行30次的均值、标准差,其中社交学习鲸鱼算法在16个基
乡村建筑群的无序发展已经严重阻碍乡村规划建设,需要对现有的乡村高密度建筑群进行密度评估,完成合理规划。为了有效提高规划效果,基于树形结构模拟方案,提出了一种新型的高密度建筑群规划方法。首先应用树形结构模拟算法,基于多分辨率乡村建筑差分图像的定理分布,完成拟合度最佳值求取,确定当前检验参数,判别不同样本图像分布函数的匹配度,从数学角度即根据应用积分均方误差的形式获取当前建筑差分图像宽窗最优值,提高建
部分传输序列(partial transmit sequence, PTS)算法能够有效降低正交频分复用(orthogonal frequency division multiplexing, OFDM)系统的峰均比(peak to average ratio, PAPR),但算法的计算复杂度较高。针对这一问题,提出了低复杂度的相位因子优化的部分传输序列算法(reduced calculation
针对网络舆情风险演化模型存在网络舆情风险预测准确性低、控制效果差的缺陷,引入大数据平台构建网络舆情风险演化模型。采用协程网络爬虫算法获取网络舆情信息,得到网络舆情观点集合,以此为基础,利用Weisbuch-Deffuant模型设定网络舆情观点聚合规则,实现网络舆情观点的聚合,以网络舆情观点聚合结果为依据,采用仓室模型搭建网络舆情信息扩散模式,以扩散模型为工具,通过敏感性分析对网络舆情风险系数进行计
针对静态环境下的移动机器人路径规划,提出一种势场-蚁群融合算法。首先,针对蚂蚁收敛速度慢,全局性较差,易陷入死锁问题,引入人工势场力构造启发信息函数;其次,为了避免蚁群陷入局部最优解,借鉴最大最小蚂蚁系统(MMAS)思想限制蚁群信息素范围;最后,引入三次B样条曲线优化路径,平滑路径的同时,进一步缩短了路径长度。仿真结果表明,算法有效可行,且经过平滑后的路径更加符合实际环境对机器人的性能要求。
针对传统方法没有充分分析负荷-容量原理,对相继故障的产生原因分析较片面,存在平均传输效率较低、故障检测消耗时间较长以及故障检测准确率较低等问题,提出抵御相继故障的无线网络路由增强算法。依据负荷-容量原理,通过建立二值影响模型与耦合印象格子模型实现对整体相继故障模型的构建,运用所构建的模型对最短路径路由算法进行改进,削弱关键节点对网络产生的影响,提高网络中各节点负载分布的均衡性。将拓扑结构所产生的影
针对传统方法没有对不良数据进行特征点提取,导致总体准确率低、召回率低和F1比值低的问题,提出无线协作中继网络多层不良数据辨识方法。利用决策树对传统数据传输通道进行优化,将不良数据平均分散到各个通道,在信号模型的基础上构建网络多层不良数据特征点提取模型,提取网络多层不良数据特征点。利用COPS算法对不良数据特征向量进行聚类,将其归一化后增量,获取聚类划分结果,同时运算出对应的聚类指标,聚类结果中平衡
在目前的人机协同仿真方法中,缺乏运动场景对仿真结果影响的考虑,影响人机协同仿真的准确性,因此提出基于MS-CNN算法的虚拟运动场景人机协同仿真研究。建立虚拟运动场景模型确定运动场景下的运动参数。运用MS-CC算法对虚拟运动场景进行运动识别,提取特征参数。拟定人机协同中的影响因素。最后运用Flexsim、Matlab和VC集成软件来进仿真开发,实现仿真方法的设计。为了验证设计的仿真方法的可行性。设计
为降低主副本数据更新延时、减少存储开销大的问题,解决分布式存储信息出现不一致的情况,提出基于模式识别的分布式存储信息一致性控制方法。通过组建中心控制端、传输控制端以及移动端构成分布式信息存储机制,了解其具有主副本数据延时更新的问题;将数据全相关一致性更新技术与模式识别法相结合,选取最优特征子集,将添加、修改、删除三种操作下形成的数据集定义为结构序列,以状态向量的记录作为数据一致性主要参考,分析对比
近年来Web前端开发框架快速发展,Angular.js、React.js、Vue.js等JavaScript框架运用前后端分离的MVVM软件架构设计模式能够更好地处理页面交互和逻辑。使用流行框架SpringBoot+Vue前后端分离技术开发方案,前端采用Vue+ElementUI+Echarts的解决手段,后端SpringBoot+MyBatis+Redis+MySQL的服务平台,搭建的B/S系统