在数据流数据库中集成聚类算法研究与实现

来源 :计算机应用研究 | 被引量 : 13次 | 上传用户:rhetthusida
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据流管理系统中集成数据挖掘功能,有助于对数据流进行更加有效的管理和挖掘,但目前研究界对此方面工作关注不够。基于数据流管理系统Esper,利用时间窗口和自定义函数,采用Esper处理语言改写Clustream算法,在Esper系统中实现聚类算法。实验结果表明,该方法可以Esper具有对数据流进行聚类分析的能力;与用Java实现数据流聚类相比,在Esper中实现聚类方法具有更好的处理多维大数据量数据流的能力。
其他文献
为了解决系统设计过程中模型一致性问题,提出了一种对UML顺序图和状态图的语义一致性检测方法。该方法对顺序图和状态图一致性进行符号化描述,为一致性检测提供理论基础;提出状态约简规则和状态约简算法,能够减少冗余状态和迁移,证明了状态约简不影响一致性检测;提出改进的UML模型到PROMELA的转换方法并使用SPIN进行验证。实验表明上述方法能够有效地检测顺序图和状态图的一致性,在验证过程中减少冗余状态和
针对非结构化P2P网络中资源搜索效率低、冗余消息较多的情况,提出一种基于兴趣因子的蚁群优化算法(IACO)。该算法充分考虑了节点价值对资源搜索的影响,在传统蚁群算法中引入节点的兴趣因子,以动态调整节点价值和信息素在计算转发概率时的权重关系,有效地指导了资源查询路径的生成。仿真结果表明,该算法可以显著提高资源查询的成功率,同时在一定程度上减少了网络中的冗余消息量。
在对防护工程损伤影响因素分析的基础上,建立了基于支持向量机的防护工程损伤评估模型,完成从评估指标到损伤指数的非线性映射。结合历年来我国发生滑坡地质灾害情况时坑道工事的实际数据对模型进行了验证。计算结果表明,与误差反向传播神经网络相比,基于支持向量机的防护工程损伤评估模型能够再现专家领域知识和直觉思维,更准确地评估防护工程损伤程度,是一种有效的评估方法。
基于身份的签名(IBS)方案可广泛应用于移动电子商务等资源受限的场合。利用Micciancio和Peikert在Eurocrypt’12上提出的陷门生成算法GenTrap、原像抽样算法SampleD和陷门委托算法DelTrap构造了一个新的基于格的IBS方案,在标准模型下基于小整数解(SIS)问题证明了所提出的方案满足选择身份和固定选择消息攻击下的强不可伪造性,并比较了所提出的方案与现有基于格的I
利用正交投影技术进行降维可以更好地保留与度量结构有关的信息,提高人脸识别性能。在谱回归判别分析(SRDA)和谱回归核判别分析(SRKDA)的基础上,提出正交SRDA(OSRDA)和正交SRKDA(OSRKDA)降维算法。首先,给出基于Cholesky分解求解正交鉴别矢量集的方法,然后,通过该方法对SRDA和SRKDA投影向量作正交化处理。其简单、容易实现而且克服了迭代计算正交鉴别矢量集的方法不适应
应用量子隐形传态将Broadbent等人提出的通用盲量子计算(universal blind quantum computation)模型和辅助量子比特驱动型量子计算(ancilla-driven universal quantum computation)模型进行结合,构造一个新的混合模型来进行计算。此外,用计算寄存器对量子纠缠的操作来代替量子比特测量操作。因为后者仅限于两个量子比特,所以代替后
为了提高文本自动分类准确率,提出一种改进的蜂群优化神经网络的选择特征的文本数据挖掘算法。该算法将文本特征选择转换成一个多目标优化问题,以特征维数最少、分类正确率最高为选择标准,采用蚁群算法找到最优特征子集,最后神经网络建立文本自动分类器,进行仿真实验测试算法性能。仿真实验结果表明,提出的方法从高维文本最优文本特征,提高了文本自动分类的正确率和识别效率,是一种有效的网络文本挖掘算法。
针对前向树状的紧急疏散网络,提出了一种不需要进行需求预测且具有适应性和强鲁棒性的分散式控制疏散策略。通过分析如何确定典型匝道与快速路交汇点处的最优疏散路线,明确了构建可控疏散网络的基本原则。定义了前向树状紧急疏散网络,并对所构建网络的适用范围和具体风险水平标定处理作了明确说明。针对前向树状网络的典型子结构,给出了可以始终充分利用下游通行能力,且充分考虑上游来流具有较高风险水平特点的具体疏散路线选择
针对数据非平稳分布而导致的异常检测差错率较高的问题,提出了一种可用单类1/4球体支持向量机模型参数表示的异常率参数动态调整自适应算法。该算法在线迭代运行,依次生成基于训
针对如何在高维数据集中寻找嵌入的低维流形结构问题,提出了基于邻近线性表示的降维方法,该算法克服了基于成对距离相似性降维算法和基于重建系数相似性降维算法的缺点。该算法具有封闭解,时间复杂度低。实验证明,与LE、ISOMAP和LLE算法相比,该算法抗噪能力强,对邻域大小选取不敏感,在采样数据比较少的情况下也能正常运行。