【摘 要】
:
对于多标签特征选择算法,通常假设数据与标签间呈现某种关系,以该关系为基础并通过正则项的约束可解决多标签特征选择问题,但该关系也可能是两种或多种关系的结合.为准确描述数据与标签间的关系并去除不相关的特征和冗余特征,基于logistic回归模型与标签流形结构提出多标签特征选择算法FSML.使用logistic回归模型的损失函数学习回归系数矩阵,利用标签流形结构学习数据特征的权重矩阵,通过L2,1-范数将系数矩阵和权重矩阵进行柔性结合,约束系数矩阵与权重矩阵的稀疏性并实现多标签特征选择.在经典多标签数据集上的实
【机 构】
:
西安工程大学 理学院,西安 710600
论文部分内容阅读
对于多标签特征选择算法,通常假设数据与标签间呈现某种关系,以该关系为基础并通过正则项的约束可解决多标签特征选择问题,但该关系也可能是两种或多种关系的结合.为准确描述数据与标签间的关系并去除不相关的特征和冗余特征,基于logistic回归模型与标签流形结构提出多标签特征选择算法FSML.使用logistic回归模型的损失函数学习回归系数矩阵,利用标签流形结构学习数据特征的权重矩阵,通过L2,1-范数将系数矩阵和权重矩阵进行柔性结合,约束系数矩阵与权重矩阵的稀疏性并实现多标签特征选择.在经典多标签数据集上的实验结果表明,与CMLS、SCLS等特征选择算法相比,FSML算法在汉明损失、排名损失、1-错误率、覆盖率、平均精度等5个性能评价指标上表现良好,能更准确地描述数据与标签间的关系.
其他文献
吞吐量的准确预测对于港口的发展具有重要意义,传统的单一模型在预测的精度或稳定性上都存在局限性.为提高吞吐量预测精度,引入Stacking算法的思想建立组合模型,并在此基础上提出了利用PCA-BP模型修正Stacking算法误差的误差修正模型;同时以1998-2017年深圳港集装箱吞吐量为实证研究对象,进行了基于BP神经网络和NARX神经网络单一预测模型、误差修正Stacking算法的预测模型及其它组合模型的预测对比分析,结果显示误差修正Stacking算法模型预测精准度最好,验证了模型的可行性,为港口的吞
传统的数据挖掘算法在面向大规模高维数据的挖掘过程中,存在数据特征捕捉准确率低、节点负载不均衡、数据交互频繁、频繁项集紧凑化程度低等问题.提出基于MapReduce的并行挖掘算法PARDG-MR,结合高维数据特征,设计基于维度粒化算法和负载均衡算法的DGPL策略,并对数据进行预处理,以解决高维复杂数据特征属性捕捉困难及数据划分中节点负载不均衡的问题.通过构建基于PJPFP-Tree树的频繁项集并行挖掘策略PARM,实现频繁项集的并行化分组过程,从而提高数据处理的运行效率.在此基础上,提出基于剪枝前缀推论的整
实体对齐表示在不同的知识图谱中查找引用相同现实身份的实体.目前主流的基于图嵌入的实体对齐方法中的对齐实体通常具有相似的属性,有效利用属性信息可提升实体对齐效果,同时由于不同知识图谱之间的知识分布差异,仅考虑单个方向的对齐预测会导致预测结果出现偏差.针对上述问题,提出一种改进的跨语言实体对齐方法.利用融合属性信息的双向对齐图卷积网络模型,将前馈神经网络编码实体对应的属性信息与初始的实体嵌入相结合,得到联合属性信息的实体表示,并使用双向对齐机制实现跨语言的实体对齐预测.在3个跨语言数据集上的实验结果表明,该方
以降低软件高速缓存侧信道对用户的危害指数,提升软件的防御能力为目的,研究移动终端软件高速缓存侧信道脆弱性识别方法.通过信号渗透率挖掘脆弱点,转换数据流脆弱点为网络关键节点,以节点度为依据,利用判决门限保持虚景概念和漏检概念平衡.通过筛选节点挖掘缓存侧信道脆弱点,比较其可能存在的不同缓存访问地址,根据脆弱点的可利用性,实现移动终软件高速缓存侧信道脆弱性的识别判断.仿真结果表明,上述方法具备较强的脆弱点识别能力,检测出脆弱点数量较多,同时具备较强的信号抗干扰能力及识别效率,可有效提升信号响应性能和脆弱点识别能
知识图谱在医疗、金融、农业等领域得到快速发展与广泛应用,其可以高效整合海量数据的有效信息,为实现语义智能化搜索以及知识互联打下基础.随着深度学习的发展,传统基于规则和模板的知识图谱构建技术已经逐渐被深度学习所替代.梳理知识抽取、知识融合、知识推理3类知识图谱构建技术的发展历程,重点分析基于卷积神经网络、循环神经网络等深度学习的知识图谱构建方法,并归纳现有方法的优劣性与发展思路.此外,深度学习虽然在自然语言处理、计算机视觉等领域取得了较大成果,但自身存在依赖大规模样本、缺乏推理性与可解释性等缺陷,限制了其进
使用特定数学模型的路由转发算法难以满足用户多样化的服务质量需求,基于深度学习的智能路由方案因具有准确性、高效性、通用性等优势,成为路由决策的发展方向.然而,目前多数智能路由算法在网络拓扑动态变化时需要重新训练,造成路由更新不及时,难以应对网络拓扑动态变化.提出一种基于图卷积神经网络(GCN)的智能路由算法.线下利用提前采集的网络信息,根据路由开销标签训练GCN智能路由模型,通过该模型输出单跳路由开销.线上采集实时信息并根据模型输出的路由开销结果对网络层路由协议进行调整,计算最小路由开销的路由路径,实现自适
COVID-19的世界性大流行对整个社会产生了严重的影响,通过数学建模对确诊病例数进行预测将有助于为公共卫生决策提供依据.在复杂多变的外部环境下,基于深度学习的传染病预测模型成为研究热点.然而,现有模型对数据量要求较高,在进行监督学习时不能很好地适应低数据量的场景,导致预测精度降低.构建结合预训练-微调策略的COVID-19预测模型P-GRU.通过在源地区数据集上采用预训练策略,使模型提前获得更多的疫情数据,从而学习到COVID-19的隐式演变规律,为模型预测提供更充分的先验知识,同时使用包含最近历史信息
点击率预估是推荐系统中的核心任务,其关键是学习有效的特征交互,但现有基于深度神经网络的点击率预估方法未考虑冷启动问题,导致准确率降低.结合特征信息和域信息的嵌入,提出一种特征交互的点击率预估方法FF-GNN.利用基于图神经网络的交互模块分别提取特征嵌入和域嵌入的结构信息,建模细粒度的特征交互和粗粒度的域交互过程.同时通过设计图神经网络的权重计算模块,交叉引用特征图神经网络和域图神经网络的低阶特征信息,实现特征交互和个性化建模域交互.在此基础上,采用注意力机制融合特征交互和域交互模块的结果预测点击率.在Cr
针对实体关系抽取任务中的三元组重叠问题,基于编码器-解码器结构的联合抽取方法能够通过序列生成的方式加以解决.但现有方法没有充分利用实体类别信息,而实体类别信息对于构建更丰富的语义特征并进一步优化关系模型的效果具有重要意义.在使用编码器-解码器结构的基础上,融合实体类别信息构建实体关系联合抽取模型FETI.编码器采用经典Bi-LSTM结构,解码器采用树状解码替代传统的一维线性解码.同时,在解码阶段增加头尾实体类别的预测,并通过辅助损失函数进行约束,使模型能够更有效地利用实体类别信息.在百度公开的中文数据集D
传统区块链技术处理交易能力弱、吞吐量低,不仅难以处理工业环境下的海量数据,而且其访问控制策略权限管理效率低,安全性不足.针对上述问题,提出一种基于主侧链合作的工业物联网访问控制策略.通过Plasma Cash框架构建高性能DPOS侧链,并根据合约将侧链与主链双向锚定,实现区块链的主侧链扩容.根据工业物联网的节点特点和主侧链区块链的运行环境,设计适用于主侧链环境的访问控制模型,访问控制模型内的主客体信息收集点阻隔外部实体直接访问,信息处理点实现访问控制策略执行与存储分离.将模型编写成图灵完备智能合约后放至侧