多标签分类方法研究及其在帕金森中医诊断中的应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:harric1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多标签分类技术快速发展,但也面临着很多困难和挑战。首先,多标签分类的输出空间随着标签数量的增大会面临指数级的扩展。大多数研究者尝试挖掘标签之间的关系解决这一问题。因此,如何有效挖掘标签之间的关系成了一个研究课题。另外,多标签数据集中标签类别不均衡也给多标签分类问题带来了挑战。针对上述问题,本文的主要工作有:(1)针对经典多标签分类算法对多标签数据集中标签关系挖掘不充分的问题,分别基于LDA、BTM和WNTM主题建模方法提出了多标签分类框架LDA-ML、BTM-ML和WNTM-ML。三个框架在标签外设立隐式主题层来挖掘标签之间的关系,并将表示标签关系的主题加入特征丰富特征中的标签关系,提高经典多标签分类算法的分类效果。此外,还使用标签的词频信息增强关键标签的作用,提高建模后挖掘标签关系的效果。(2)针对多标签数据集中标签不均衡的应用场景,提出基于监督主题模型的多标签分类算法FAL。该算法通过监督主题模型建立特征和标签之间的关系,并通过特征的词频信息和每个样例中的标签个数更新建模时的狄利克雷先验,使其更符合特征的先验分布和样例的标签分布,最终提高算法对标签的分类效果。(3)针对多标签数据集中标签数量多,标签间关系复杂的应用场景,提出基于监督主题模型的多标签分类算法FNAL。该算法在训练阶段使用WNTM建立标签和隐式主题之间的关系模型。在预测阶段,FNAL用主题和标签建模时的采样信息更新测试示例中标签分布的狄利克雷先验,从而更准确的获取测试示例的标签分布先验信息,提高算法的分类效果。(4)针对中医诊断帕金森病的实际应用场景,结合前文提出的框架和算法给出解决方案。使用的数据集是由南京脑科医院提供的帕金森病中医量表转换而成。中医量表通过辩证方法采集病人的病症特征,每个病人对应一个主证型或者同时伴有一个主证型和一个次证型。本文通过将病症作为特征,证型作为标签,将中医诊断帕金森病问题转换为多标签分类问题。然后尝试用本文提出的多标签分类框架和多标签分类算法解决转换后的多标签分类问题。实验表明,本文提出的方法对由实际应用场景建模获得的帕金森数据集有较好的分类效果。
其他文献
潜水器是进行海洋探索、参与国际竞争、提振国家实力必不可少的战略设备。同时潜水器也是多个领域的交叉产品。我国在潜水器研究领域有着卓越的成果,如潜龙一号、潜龙二号与
近年来,随着隧道工程施工技术发展的越来越成熟,公路与铁路的建设在路线选择上更加多元化,由原来的避山绕路到现在的凿山取直,隧道工程发挥着重要的作用。但是东北地区冬天寒
多智能体系统近年来成为控制领域和人工智能领域研究的一个热点问题,其中系统的一致性问题具有广泛的应用价值,被大量学者所关注。本文在一致性研究的基础上,充分考虑到系统
长期以来,我国始终坚持积极主动的开放战略,主动对接国际惯例,营造公平竞争环境,不断创新对外投资方式,优化对外投资结构,稳步推进对“一带一路”国家投资,积极在全球各国并
聚类分析作为一种无监督学习方法,是机器学习领域重要的研究方向之一,已经成功应用到金融、商业、社交网络、生物信息学等领域。目前存在大量成熟有效的聚类算法,其中基于图
在智能交通系统中,短时交通流预测能有效改善交通拥堵,提高出行效率,具有重要的学术价值和现实意义。针对交通流预测问题,大部分现有模型仅考虑当前预测路段的历史交通流数据
颤振是大跨度悬索桥设计的控制因素之一,如何有效提高大跨度悬索桥颤振稳定性是其抗风设计的重点。影响桥梁结构颤振稳定性的主要因素有桥梁结构体系、加劲梁气动外形和气动
轨迹规划是机器人高性能运行的重要前提和保证。连续轨迹对精度要求较高,现有连续轨迹规划算法计算量大,针对连续轨迹的规划算法仍有待研究和发展。现有最优轨迹规划算法依赖
负虚性质广泛存在于各种工程应用中,吸引了广大控制领域学者的关注。目前对于负虚系统理论的研究局限于负虚系统定义和性质的延伸推广和线性系统稳定性理论部分。在实际场景
在构筑密集的城市修建地下隧道时,隧道穿越毗邻结构对既有结构桩基础的影响是工程人员亟需研究的问题。本文采用室内模型试验和有限元分析方法探究了盾构法隧道掘进对单桩和