论文部分内容阅读
目的:
中医学注重辨证论治。辨证论治以证候为中心来认识、治疗疾病,传统上中医学对证候的辨识通常来自中医医师的主观判断,缺乏客观、统一、可量化的标准。因此,想要推动中医药现代化研究,中医诊断的客观化与证候的量化是亟需解决的课题。传统的统计学方法、现代测量学方法以及计算机自适应测试等技术都被运用到了中医证候量化与诊断模型的构建当中。然而,传统的统计学方法多建立在线性化与单维度的假设之上,与中医的临床辨证理论并不相符。多维项目反应理论等现代测量学方法虽然具有非线性及多维度的测量学特征,但仍建立在数学概率模型的基础之上,很难与由人脑进行的复杂抽象的中医辨证思维过程完全拟合。当今热门的机器学习算法如神经网络算法可以模拟人脑认知,在中医诊断中的应用正逐步深入,可能作为新的技术方法被引入到中医证候量化诊断模型的研究中。此外,证素理论以病位、病性等证候的要素作为研究核心,以此还原临床医生的辨证思维过程,这种原子化的分析方法为在中医证候量化研究中引入机器学习算法等现代信息技术提供了研究基础。
本研究以功能性胃肠病中的两种常见脾胃系病种,功能性消化不良以及腹泻型肠易激综合征的患者作为研究对象,引入中医证素的辨证理论,结合跨学科信息技术的发展趋势,运用神经网络等机器学习算法作为技术工具,建立并优化功能性胃肠病中医证候量化诊断模型,探求可用于中医证候量化的方法学新思路与新突破,为临床决策及科学研究提供工具支持,并为推动中医药的现代化研究和临床量表的应用与转化提供可供参考的方法学范例。
方法:
1.临床调查:本研究采用回顾性与前瞻性研究相结合的方式,分两个阶段开展临床病例的调查。本阶段先通过回顾性研究来进行临床病例的采集与数据分析,为后两个阶段结合传统数理统计方法与现代机器学习算法完成理论模型与诊断模型的构建优化提供数据资源。再以前瞻性研究提供的数据资源对构建出的量化诊断模型进行准确性评价。所纳入的临床病例来源于从2015年10月起至2019年12月止在广州中医药大学第一附属医院脾胃科及各合作研究单位就诊,并经专家临床诊断为功能性消化不良及腹泻型肠易激综合征,中医诊断为胃痛、胃痞和泄泻的患者。其中西医诊断标准参照《功能性胃肠病罗马Ⅳ诊断标准》中关于FD及IBS-D的定义,中医诊断标准则主要参照权威诊断规范或指南的相关规定。两阶段调查总样本量设定为2000例。基于前期研究所建立的《功能性消化不良及腹泻型肠易激综合征中医临床辨证信息调查量表》,对包括研究对象的个人信息、临床症状体征及专家辨病辨证诊断结果等在内的临床数据进行采集整理,并采用描述性统计方法对临床病例数据的基本资料进行分析。
2.理论模型构建与优化:基于临床调查中各病种的证候分布特点,结合中医理论中各证候的定义及各病种最新专家诊疗共识的相关阐述,提取与各条目所代表的临床表征所相关的辨证要素,再运用频数计数的统计方法,从相关辨证要素中提取各病种的核心证素,经过专家小组的评议以及调整,形成多层次、多维度辨证理论模型。借助Pythonscikit-learn机器学习库,运用决策树、随机森林、梯度提升树等机器学习算法对各证素相关的临床表征条目进行筛选调整,并以多因素Logistic回归分析得到的结果作为基线,进行多种筛选方法的比较,结合比较分析的最终结果,筛选出各核心证素相关的临床表征,实现理论模型的结构精简优化。
3.诊断模型构建与优化:以回顾性研究所采集的临床病例为基础,运用神经网络等机器学习算法,建立定量化的辨证规则网络,结合理论模型建立中医证候诊断模型。首先以FGIDs各病种全部临床表征条目作为输入层节点,以核心证素作为输出层节点,基于BP神经网络算法,运用PythonKeras人工神经网络库,进行多层次神经网络的计算和反馈,输出层次化、多维度辨证分析结果,初步构建各病种的全条目FGIDs诊断模型作为基线参考,与其他模型进行比较。再以经筛选的各核心证素相关的临床表征条目作为输入层节点,以核心证素作为输出层节点,构建模型,与全条目模型进行比较,最终实现中医证候量化诊断模型的构建与优化。
4.诊断模型的评价:利用前瞻性病例数据,在SPSS22.0软件中运用ROC曲线参照临床诊断结果,以临床诊断作为状态变量,各核心证素的模型输出结果作为检验变量,绘制各证素的ROC曲线,参考ROC曲线下的面积判断模型诊断结果的可靠性,对模型的准确性进行评价。
成果:
经过两阶段的临床调查,总计纳入临床病例2328例,包括胃痛病例780例(33.51%),胃痞病例789例(33.89%),泄泻病例759例(32.60%)。参考各病种最新的权威指南和专家诊疗共识总计9份,提取出的相关辨证要素,再根据临床病例证候辨证要素分布情况,从中提取出胃痛病的7个核心证素,包括“脾”、“气滞”、“胃”、“肝”、“气虚”、“湿”、“热”;胃痞病的8个核心证素,包括“脾”、“气滞”、“胃”、“气虚”、“肝”、“湿”、“热”、“阳虚”;泄泻病的8个核心证素,“脾”、“气滞”、“气虚”、“肝”、“湿”、“胃”、“热”、“阳虚”。基于提取出的核心证素,初步建立待优化的FGIDs中医多维证候理论模型,模型包括胃痛病核心证素7个、临床表征177个,胃痞病核心证素8个、临床表征155个,泄泻病核心证素8个,临床表征173个。运用机器学习算法以及多因素Logistic回归分析,筛选出胃痛病7个核心证素相关的临床表征共计67个,胃痞病8个核心证素相关的临床表征共计65个,泄泻病8个核心证素相关的临床表征共计68个,最终建立并优化了以“病-证-证素-临床表征”作为基本结构的理论模型。
在理论模型的基础上,基于神经网络等机器学习算法建立了三病种的证候量化诊断模型。通过模型间准确性的比较,对模型结构进行了优化调整,最终选择基于神经网络算法构建并进行条目结构优化的诊断模型。经过ROC曲线分析对模型进行评价,模型的辨证准确性在中等水平,随着样本量的继续扩大,仍存在可以提升的空间。
结论:
本研究以功能性胃肠病为例,创新性地将机器学习算法中的属性筛选运用到了量表当中,利用机器学习算法,计算属性即各临床表征条目的重要性,从而实现了条目的筛选和理论模型的精简优化。此外,传统神经网络虽已被运用于中医临床诊断,但现有的神经网络模型多是按照中医主证证型进行分类,无法解决兼证的问题,本研究基于中医证素理论,将神经网络算法与机器学习、量表以及证候量化相结合,构建与优化证候量化诊断模型,较好地解决了兼证问题,更符合临床辩证实际。同时本研究着重于将神经网络等机器算法运用于中医证候量化的方法学探讨上,得出基于神经网络与机器学习算法构建中医证候量化诊断模型是可行的,这一结论可为中医证候量化领域提供方法学的新思路。在当今“互联网+”的背景下,随着大数据与人工智能的普及,将中医证候量化与机器学习相结合,也符合时代的发展趋势,具有广阔的应用前景。
中医学注重辨证论治。辨证论治以证候为中心来认识、治疗疾病,传统上中医学对证候的辨识通常来自中医医师的主观判断,缺乏客观、统一、可量化的标准。因此,想要推动中医药现代化研究,中医诊断的客观化与证候的量化是亟需解决的课题。传统的统计学方法、现代测量学方法以及计算机自适应测试等技术都被运用到了中医证候量化与诊断模型的构建当中。然而,传统的统计学方法多建立在线性化与单维度的假设之上,与中医的临床辨证理论并不相符。多维项目反应理论等现代测量学方法虽然具有非线性及多维度的测量学特征,但仍建立在数学概率模型的基础之上,很难与由人脑进行的复杂抽象的中医辨证思维过程完全拟合。当今热门的机器学习算法如神经网络算法可以模拟人脑认知,在中医诊断中的应用正逐步深入,可能作为新的技术方法被引入到中医证候量化诊断模型的研究中。此外,证素理论以病位、病性等证候的要素作为研究核心,以此还原临床医生的辨证思维过程,这种原子化的分析方法为在中医证候量化研究中引入机器学习算法等现代信息技术提供了研究基础。
本研究以功能性胃肠病中的两种常见脾胃系病种,功能性消化不良以及腹泻型肠易激综合征的患者作为研究对象,引入中医证素的辨证理论,结合跨学科信息技术的发展趋势,运用神经网络等机器学习算法作为技术工具,建立并优化功能性胃肠病中医证候量化诊断模型,探求可用于中医证候量化的方法学新思路与新突破,为临床决策及科学研究提供工具支持,并为推动中医药的现代化研究和临床量表的应用与转化提供可供参考的方法学范例。
方法:
1.临床调查:本研究采用回顾性与前瞻性研究相结合的方式,分两个阶段开展临床病例的调查。本阶段先通过回顾性研究来进行临床病例的采集与数据分析,为后两个阶段结合传统数理统计方法与现代机器学习算法完成理论模型与诊断模型的构建优化提供数据资源。再以前瞻性研究提供的数据资源对构建出的量化诊断模型进行准确性评价。所纳入的临床病例来源于从2015年10月起至2019年12月止在广州中医药大学第一附属医院脾胃科及各合作研究单位就诊,并经专家临床诊断为功能性消化不良及腹泻型肠易激综合征,中医诊断为胃痛、胃痞和泄泻的患者。其中西医诊断标准参照《功能性胃肠病罗马Ⅳ诊断标准》中关于FD及IBS-D的定义,中医诊断标准则主要参照权威诊断规范或指南的相关规定。两阶段调查总样本量设定为2000例。基于前期研究所建立的《功能性消化不良及腹泻型肠易激综合征中医临床辨证信息调查量表》,对包括研究对象的个人信息、临床症状体征及专家辨病辨证诊断结果等在内的临床数据进行采集整理,并采用描述性统计方法对临床病例数据的基本资料进行分析。
2.理论模型构建与优化:基于临床调查中各病种的证候分布特点,结合中医理论中各证候的定义及各病种最新专家诊疗共识的相关阐述,提取与各条目所代表的临床表征所相关的辨证要素,再运用频数计数的统计方法,从相关辨证要素中提取各病种的核心证素,经过专家小组的评议以及调整,形成多层次、多维度辨证理论模型。借助Pythonscikit-learn机器学习库,运用决策树、随机森林、梯度提升树等机器学习算法对各证素相关的临床表征条目进行筛选调整,并以多因素Logistic回归分析得到的结果作为基线,进行多种筛选方法的比较,结合比较分析的最终结果,筛选出各核心证素相关的临床表征,实现理论模型的结构精简优化。
3.诊断模型构建与优化:以回顾性研究所采集的临床病例为基础,运用神经网络等机器学习算法,建立定量化的辨证规则网络,结合理论模型建立中医证候诊断模型。首先以FGIDs各病种全部临床表征条目作为输入层节点,以核心证素作为输出层节点,基于BP神经网络算法,运用PythonKeras人工神经网络库,进行多层次神经网络的计算和反馈,输出层次化、多维度辨证分析结果,初步构建各病种的全条目FGIDs诊断模型作为基线参考,与其他模型进行比较。再以经筛选的各核心证素相关的临床表征条目作为输入层节点,以核心证素作为输出层节点,构建模型,与全条目模型进行比较,最终实现中医证候量化诊断模型的构建与优化。
4.诊断模型的评价:利用前瞻性病例数据,在SPSS22.0软件中运用ROC曲线参照临床诊断结果,以临床诊断作为状态变量,各核心证素的模型输出结果作为检验变量,绘制各证素的ROC曲线,参考ROC曲线下的面积判断模型诊断结果的可靠性,对模型的准确性进行评价。
成果:
经过两阶段的临床调查,总计纳入临床病例2328例,包括胃痛病例780例(33.51%),胃痞病例789例(33.89%),泄泻病例759例(32.60%)。参考各病种最新的权威指南和专家诊疗共识总计9份,提取出的相关辨证要素,再根据临床病例证候辨证要素分布情况,从中提取出胃痛病的7个核心证素,包括“脾”、“气滞”、“胃”、“肝”、“气虚”、“湿”、“热”;胃痞病的8个核心证素,包括“脾”、“气滞”、“胃”、“气虚”、“肝”、“湿”、“热”、“阳虚”;泄泻病的8个核心证素,“脾”、“气滞”、“气虚”、“肝”、“湿”、“胃”、“热”、“阳虚”。基于提取出的核心证素,初步建立待优化的FGIDs中医多维证候理论模型,模型包括胃痛病核心证素7个、临床表征177个,胃痞病核心证素8个、临床表征155个,泄泻病核心证素8个,临床表征173个。运用机器学习算法以及多因素Logistic回归分析,筛选出胃痛病7个核心证素相关的临床表征共计67个,胃痞病8个核心证素相关的临床表征共计65个,泄泻病8个核心证素相关的临床表征共计68个,最终建立并优化了以“病-证-证素-临床表征”作为基本结构的理论模型。
在理论模型的基础上,基于神经网络等机器学习算法建立了三病种的证候量化诊断模型。通过模型间准确性的比较,对模型结构进行了优化调整,最终选择基于神经网络算法构建并进行条目结构优化的诊断模型。经过ROC曲线分析对模型进行评价,模型的辨证准确性在中等水平,随着样本量的继续扩大,仍存在可以提升的空间。
结论:
本研究以功能性胃肠病为例,创新性地将机器学习算法中的属性筛选运用到了量表当中,利用机器学习算法,计算属性即各临床表征条目的重要性,从而实现了条目的筛选和理论模型的精简优化。此外,传统神经网络虽已被运用于中医临床诊断,但现有的神经网络模型多是按照中医主证证型进行分类,无法解决兼证的问题,本研究基于中医证素理论,将神经网络算法与机器学习、量表以及证候量化相结合,构建与优化证候量化诊断模型,较好地解决了兼证问题,更符合临床辩证实际。同时本研究着重于将神经网络等机器算法运用于中医证候量化的方法学探讨上,得出基于神经网络与机器学习算法构建中医证候量化诊断模型是可行的,这一结论可为中医证候量化领域提供方法学的新思路。在当今“互联网+”的背景下,随着大数据与人工智能的普及,将中医证候量化与机器学习相结合,也符合时代的发展趋势,具有广阔的应用前景。