论文部分内容阅读
主动脉夹层发病急,临床症状缺乏灵敏度,漏诊率和误诊率高,预后凶险,是主要的主动脉疾病致死原因。近年来我国主动脉夹层的发病比例有上升态势,但病理机制研究尚无明确结论,其危险因素和未知的其他发病原因有待进一步研究。因此,本文围绕主动脉夹层危险因素、主动脉夹层患病预测方法进行分析和研究。本研究收集了昆明某医院收治的157例主动脉夹层患者和同一时期在该医院体检的157例非主动脉夹层患者一般资料、病史资料作为研究对象。首先,对数据进行预处理。将研究数据分为两组,157例罹患主动脉夹层患者为患病组,157例未患主动脉夹层患者为对照组,经临床专家指导,收集与罹患主动脉夹层可能有关的一般资料、病史资料作为研究对象。对数据进行预处理,缺失数据用平均法填补;绘制堆积直方图、箱型图,统计频数表,对数据进行描述性统计分析。本研究患者数量(157例),接近变量数(16个)的10倍,样本量基本充足。使用单变量分析16个因素,排除无统计意义的5个因素,剩下11个因素(即高血压、动脉粥样硬化、马凡综合征、白塞氏病、主动脉二瓣化畸形、吸烟、饮酒、冠心病、糖尿病、单纯性肾囊肿、主动脉瘤病史)作为下一步研究的基础。第二,建立Logistic回归模型对11个变量进行分析,得到具有统计显著性(P<0.05)的6个危险因素:高血压(OR=5.246)、动脉粥样硬化(OR=4.296)、马凡综合征(OR=4.284)、白塞氏病(OR=22.271)、吸烟(OR=1.318)、饮酒(OR=2.291)。第三,建立相关性分析模型对11个变量进行分析,得到10个相关性较高的危险因素:高血压、动脉粥样硬化、主动脉二瓣化畸形、单纯性肾囊肿、冠心病、白塞氏病、吸烟、饮酒、马凡综合征、主动脉瘤病史。相关性分析结果包括logistic回归的6个危险因素。两个模型对主动脉二瓣化畸形、冠心病、单纯性肾囊肿、主动脉瘤病史与患病的影响有争议。考虑到以上两个模型主要针对具有线性特点的数据,而本组具有一定的非线性特点,因此本文接着对模型进行了非线性改进,以对有争议的危险因数进一步辨析。第四,针对主动脉夹层的多个危险因素之间存在的非线性相关性,引入RBF核函数建立非线性对应关系改进logistic回归模型,得到8个危险因素:高血压、白塞氏病、马凡综合征、吸烟、饮酒、动脉粥样硬化、主动脉瘤史、单纯性肾囊肿。将得到的8个危险因素送临床专家组讨论,专家组认为改进logistic回归得到的8个危险因素与临床经验怀疑的危险因素一致性较高。查阅文献资料的结果也证实了改进logistic回归得到的8个危险因素是较为准确的。第五,使用改进logistic回归得到的8个危险因素对314个样本数据进行研究,建立SVM、LSSVM(最小二乘支持向量机)模型预测主动脉夹层的患病情况。选择十折交叉验证法进行试验,SVM模型的预测准确率为70.06%,LSSVM准确率为85.99%,说明LSSVM预测模型能够较为准确的发现主动脉夹层患者。本研究筛选出主动脉夹层的8个危险因素,建立了主动脉夹层疾病预测模型,为临床医生提早关注高危人群,早发现早治疗主动脉夹层提供了理论基础。