基于谱聚类和L2,1范数的多视图聚类算法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:khalista7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了获得结构更加合理的相似矩阵,提出了基于谱聚类和L2,1范数的多视图聚类算法.该算法首先将改进的多视图亲和矩阵利用L2,1范数正则项合理地构造出相似矩阵S,使S在整体稀疏的情况下保证局部的强线性关系;然后同时进行相似矩阵的学习和谱聚类过程,将相似矩阵S和标签矩阵F交替迭代,加强数据集与降维后的F的几何结构的紧密联系;最后对所提出的算法进行了实验,结果表明该算法是有效的.
其他文献
针对常用方法无法准确度量多元时间序列相似程度的问题,提出一种基于多维分段和动态权重动态时间弯曲距离的多元时间序列相似性度量方法.首先对多元时间序列进行多维分段拟合,选取拟合段的斜率、均值和时间跨度作为每一段的特征,在对多元时间序列降维的同时也保留了变量之间的相关性;然后提出一种动态权重动态时间弯曲距离度量方法计算多元时间序列特征矩阵之间的距离,避免了直接使用动态时间弯曲距离造成的畸形匹配问题.最终实验结果也验证了该方法在多种类型的数据集上都能取得较高的度量精度,表明了该方法的有效性.
针对各导航软件快速给出私家车出行最佳路线却无法满足用户个人偏好的问题,论文基于2017年11月全国8186台私家车的出行轨迹,提出一种个性化路线推荐的优化方法.通过混合高斯模型拟合偏好分布,分析相关性找出与当前用户偏好和出行时间最为相近的轨迹,最后从中选择一条最符合用户需求的路线.与DAI方法相比,推荐路线匹配度高于80%的推荐轨迹高出了47%,推荐准确度也有了大幅度的提高,准确度对比平均值达到1.102.
中西医在线问询意图的自动识别是捕获患者核心需求、提高在线问询效率与质量的一个关键环节.提出结合句法结构的图编码分类模型SGM,第一步利用ddparser解析短文本的句法结构,抽取表达文本核心内容的主、谓、宾短语,得到句法依存关系图,进而采用双层图卷积神经网络编码得到128维的文本特征向量;第二步使用SVM、Bayes等分类器完成16597条患者问询意图分类.选取脱敏的中文在线问询数据集开展实验,结果表明SGM分类效果最佳,较直接进行机器学习模型分类的F1值可提高17.6%;较融合句法结构的神经网络(BiG
不平衡数据的分类问题在数据挖掘和机器学习领域中,一直是备受关注的问题.论文从数据预处理方面出发,提出一种基于谱聚类的欠采样方法,以此来降低数据的不平衡程度.先对多类样本进行谱聚类,根据每个聚类簇的密集程度,以及到少类样本的平均距离,来计算每个聚类簇的采样数目和选取怎样的多类样本,此欠采样方法可以有效去除多数类的冗余数据.实验结果证明,该算法可以有效提升少类样本的分类效果.
为解决工控网异常入侵、水利泵站通信网安全防护的问题.论文提出一种基于深度神经网络的水利泵站工控网入侵数据的检测算法.首先针对泵站工控网内的数据进行预处理,通过自编码算法对数据进行特征提取、降维处理;利用深度神经网络模型结合受限玻尔兹曼机对各类数据进行训练,采用Adadelta算法进行网络模型的参数优化,并由Softmax分类器对工控网数据进行是否合法判别.实验数据集由底层设备实地采集到的水利泵站工控网内流动数据导入到本地数据库.实验结果表明:该方法的准确率对比深度神经网络未改进前的算法提高了3.76%,检
自动文本摘要是一种利用计算机从原始文本中提取出一段能够反映原始文本主旨的连贯短文的文本摘要方法.所提出的基于注意力机制与拷贝机制的编码-解码抽象式文本摘要模型,能够在把握整体语义的同时利用注意力机制生成关键信息和局部细节;并通过借鉴人工摘要的复制思想,引入拷贝机制,提高模型的实体识别能力;同时使用文本简化、批量归一化和计划采样对模型进行了强化.通过使用中国裁判文书网法律文书数据集进行验证,结果表明所提方法能够应用于复杂文本摘要生成,也初步探讨了文本摘要在法律自动判决上的应用.
通过对极限学习机的改进,运用基于岭回归的极限学习机分类器进行垃圾用户的分类,通过比对SVM等分类法,针对爬虫得到的新浪用户数据集为研究对象,达到了速度快且精确度相对较高的分类.对于原本就信息过载,信息质量层次不齐的社交网络,具有一定的借鉴意义.
主流的情感分析模型是基于依存树和注意力机制的LSTM神经网络模型,但依存树捕捉依存关系较弱;注意力机制有时隐藏层和目标向量维度可能不一致,且归一化后对应的梯度将会变小,使模型很难训练.针对上述问题,提出一种基于依存图和双线性串联平衡因子的注意力机制情感分析模型(BSBDG-LSTM),引入依存图形结构,允许多个依存根节点存在,使依存关系理解更加充分;在注意力机制中添加可学习的参数矩阵和平衡因子,使隐藏层和向量的维度保持一致,并降低维度系数.电商评论数据的实验结果表明,BSADG-LSTM模型比LSTM模型
为了提高安检图像质量,提出用Retinex算法对其进行增强处理,并对Retinex算法做了改进。改进算法首先结合反锐化掩模(Unsharp Masking,USM)算法中提高高频成分的思想,增强了安检图像的轮廓部分;然后用限制对比度自适应直方图均衡化(Contrast Limited Adaptive Histogram Equalization,CLAHE)算法增强图像对比度。实验结果和数据表明
传统的数字岩心建模方法建立的数字岩心模型尺寸单一,分辨率固定,导致存储空间过大,难以维护等问题。因此,提出了一种分层四叉树模型,给出了模型的构建及扩展方法,基于此模型,建立多分辨率数字岩心体素模型,同时在分层四叉树模型基础上,结合Marching Cubes移动立方体算法生成数字岩心面模型。通过实例检验证明,该方法建立的数字岩心模型极大地节省了存储空间,耗时较少,同时具有易于维护管理等优点。