论文部分内容阅读
第一部分中国皮肤科医生对人工智能态度的网络调研背景:人工智能在医学领域得到了越来越多地关注和应用,皮肤病学是一门基于形态学特征来诊断疾病的学科,特别适宜发展皮肤病学的人工智能。我国已经开展了许多针对皮肤病的人工智能研究,并且许多人工智能产品逐步应用于日常诊疗活动中。然而,中国皮肤科医生对于人工智能的态度尚不清楚,目前尚无相关调查研究。目的:采用网络问卷调查的方式了解中国皮肤科医生对于人工智能信息的关注度,对人工智能角色的定位,并从皮肤科医生的角度出发,分析和探讨人工智能在皮肤科的应用场景,以及哪些皮肤病较为适合和需要开展人工智能研究和应用等信息。方法:由中国人群皮肤影像资源库的专家设计网络调查问卷,在皮肤科医生在线学习平台一“优麦医生”app上发布问卷,邀请中国皮肤科医生在线参加问卷调查。采用Mann-Whitney U检验和Kruskal-Wallis H检验比较不同组(年龄、性别、医院级别、教育程度、职称和医院性质)的皮肤科医生对人工智能态度的差异。采用Spearman等级相关检验计算分层因素与皮肤科医生对人工智能态度的相关性。所有分析均采用SPSS(22.0版)软件,双侧p<0.05认为具有统计学意义。结果:共有来自30个省、自治区、直辖市及其他地区(包括香港、澳门、台湾)的1228名皮肤科医生参与了本次调查并填写有效问卷。参与调查的皮肤科医生主要通过互联网、会议或论坛等途径获取人工智能相关信息,70.51%参与调查的皮肤科医生通过两种或两种以上途径获取人工智能相关信息。总体来看,99.51%参与调查的皮肤科医生关注(一般关注、被动关注和主动关注)与人工智能有关的信息。分层分析显示不同性别、医院级别、教育程度和职称的皮肤科医生对人工智能相关信息的关注程度(不关注、一般关注、被动关注和主动关注)的差异具有统计学意义(p≤1.79E-02)。有95.36%的皮肤科医生认为人工智能的作用是“辅助皮肤科医生进行日常诊疗活动”。对人工智能角色(不关心、没有用处、辅助皮肤科医生、取代皮肤科医生)的分层分析表明,除医院级别外,其余差异没有统计学的意义(p=4.09E-03)。分层因素与人工智能的关注程度、人工智能的角色观点之间的相关性极弱。此外,64.17%的皮肤科医生认为我国二级医院最需要应用人工智能,有91.78%参与调查的皮肤科医生认为人工智能应优先应用于皮肤肿瘤。结论:大多数中国皮肤科医生对人工智能信息感兴趣,并通过多种途径获得人工智能信息。几乎所有的皮肤科医生都关注人工智能信息,认为人工智能的作用是“辅助皮肤科医生的日常诊疗活动”。未来人工智能的应用应主要集中在皮肤肿瘤和二级医院。第二部分皮肤肿瘤人工智能辅助决策软件在现实世界的诊断能力背景:优智皮肤人工智能软件是基于中国人群皮肤影像资源库的皮肤肿瘤数据所开发的首款黄色人种皮肤肿瘤人工智能辅助决策系统。该软件通过前期在特定数据集上的测试,表现出较高的诊断性能。目的:探究优智皮肤人工智能软件和皮肤科医生识别真实临床环境下的皮肤肿瘤图像的诊断能力,及两者在不同模式下诊断能力的差异。方法:选取2017年7月至2019年6月就诊于中日友好医院皮肤科行皮肤肿瘤切除术,并经病理检查确诊为皮肤肿瘤的患者106例。使用优智皮肤人工智能软件和1 1名不同皮肤镜诊断水平的皮肤科医生分别通过识别106例患者皮肤肿瘤的临床图像和皮肤镜图像给出诊断结果。主要结果是比较优智皮肤人工智能软件与皮肤科医生的诊断准确率,以及与在实验室使用特定数据集测试的结果进行比较。次要结果包括优智皮肤人工智能软件在现实世界中的敏感度、特异度、阳性预测值、阴性预测值、F值和马修斯相关系数等。结果:优智皮肤人工智能软件在真实临床环境中的诊断准确率低于实验室的测试数据(p<0.001)。经过多次测试,优智皮肤人工智能软件的输出结果具有良好的稳定性。通过识别皮肤镜图像,优智皮肤人工智能软件诊断疾病良恶性及疾病类型的诊断准确率高于识别临床图像得到的准确率(p=0.008,p=0.016)。与皮肤科医生相比,优智皮肤人工智能软件通过识别皮肤镜图像诊断疾病类型具有更高的准确率(p<0.01)。通过评估皮肤科医生在不同模式下(乱序模式、匹配模式)的诊断能力,皮肤科医生在匹配模式下诊断疾病类型的准确率显著高于乱序模式的准确率(p=0.022)。皮肤科医生通过识别皮肤镜图像诊断良恶性的诊断准确率明显高于通过识别临床图像得到的准确率(p=0.010)。结论:优智皮肤人工智能软件在真实临床环境下对皮肤肿瘤的诊断准确率没有实验室特定数据集测试的准确率高。但是,优智皮肤人工智能软件的诊断能力与皮肤科医生的平均诊断能力无显著差异。因此,该软件通过进一步训练提高性能,今后可以为基层医生或经验不足的皮肤科医生提供辅助诊断决策。第三部分一种基于卷积神经网络的面部寻常痤疮辅助分类方法背景:寻常痤疮是一种常见的慢性皮脂腺疾病,严重影响青少年的身心健康。正确识别痤疮不同性质的皮损类型,有助于疾病的诊断、分级和管理。卷积神经网络在图像识别、图像分类上表现出良好的性能,在痤疮皮损类型分类上具有应用潜力。目的:基于一种卷积神经网络算法,对寻常痤疮的VISIA图像进行学习训练,实现对寻常痤疮的不同性质皮损进行分类,同时与初级皮肤科医生的痤疮分类能力进行比较。方法:寻常痤疮VISIA图像来源于中国人群皮肤影像资源库寻常痤疮专病数据库,依据Pillsbury4级分级法对患者痤疮严重程度进行分级。由8名经过标准化培训的皮肤科医生使用Labelme对VISIA三个方位的图像进行标注,标注标签分别为粉刺、丘疹、结节、脓疱、囊肿和瘢痕。标注图像由2名皮肤科专家进行审核。使用EfficientNet-B3作为骨干网络,采用5折交叉验证法进行训练。使用精准率、召回率、F1值、ROC曲线和AUC值作为评估分类模型性能的指标。从测试集中随机选取部分痤疮皮损图像对初级皮肤科医师进行分类测试,并对分类结果的确定程度进行选择。使用Kruskal-Wallis秩和检验比较多组独立数据均值之间的差异,使用单样本t检验或Wilcoxon符号秩检验比较皮肤科医生和分类模型的分类能力。所有分析均采用SPSS(24.0版)软件,双侧p<0.05认为具有统计学意义。结果:共纳入1075名患者的VISIA图像,截取出19669张经过标注的皮损图像。分类模型经过5折验证测试,对测试集分类的平均准确率为0.8127,六类皮损(粉刺、丘疹、结节、脓疱、囊肿、瘢痕)分类的召回率分别为0.8510、0.8735、0.1724、0.7169、0.5789、0.8266。皮肤科医生对随机选取的六类皮损分类的召回率分别为0.8094、0.6480、0.5800、0.8261、0.5080、0.8931,皮肤科医生之间对于丘疹、结节、囊肿分类的召回率差异具有统计学意义(p<0.05)。皮肤科医生对于六类皮损结果的确定程度均值分别为8.375分、6.560分、5.271分、8.739分、6.640分、7.914分,六类皮损的确定程度分值差异具有统计学意义(p<0.001)。分类模型对于粉刺、丘疹分类的召回率高于皮肤科医生分类的召回率,且差异具有统计学意义(p<0.01)结论:目前分类模型对于结节和囊肿的分类性能较低,有待通过补充训练样本等手段进一步提高性能。初级皮肤科医生对于丘疹、结节、囊肿的分类能力低于其他类型皮损,同时对分类结果的确定程度信心不足,人工智能可能会成为辅助皮肤科医生诊治痤疮的有力工具。