临床医学纵向数据的分析方法研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:asnbgq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医学技术的发展,医学数据也在大量的积累。为迎合临床诊断、科研教学方面的需求,临床医学数据分析技术逐渐成为临床医学领域研究的热点。临床医学数据主要包括截面数据,时间序列数据和纵向数据。截面数据是指在同一次调查中得到的数据,在医学上可以用来分析疾病的影响因素。时间序列数据是指随着时间的变化收集到的数据。不同于上面两种数据,纵向数据是把截面数据和时间序列数据相结合的方式,在临床上以随访的方式收集到的多个患者的检测数据。通过分析纵向数据,能得到个体特征随时间变化的趋势,也可以分析出个体之间的差异性。因此临床纵向数据的分析有着很重要的医学意义。本文在对临床医学纵向数据的特点进行分析后,提出了面向医学纵向数据的聚类分析算法和变量选择算法。然后建立了改进了的多层线性模型,并通过分析实际的临床医学纵向数据验证了我们的多层线性模型在临床医学纵向数据研究中的有效性。本文的研究工作内容具体如下:(1)根据医生长期的临床经验,尤其结合中医对患者体质的区分思想,即使同一病种、同一分期的患者,其疾病发展的趋势也不尽相同,而且医生经验往往认为这些患者的疾病发展趋势可以进一步细分为几类。也就是说,一些病人之间往往会存在相似的病理发展趋势或者相同的症状,但是对研究人群而言,到底疾病变化趋势的发展分为几类,医生经验无法给出。因此,需要根据医学纵向数据将病人的疾病发展趋势进行聚类分析,得到的类别可以给医生提供一些诊疗建议。考虑到临床医学纵向数据多维度的特点,我们提出扩展范式距离来度量病人间的相似性,并结合不受聚类中心随机选择影响的改进K均值算法进行纵向数据的聚类分析。然后对非小细胞肺癌纵向数据和妊娠高血压纵向数据分别进行了对比实验。实验结果表明,我们的方法可以对纵向数据可以实现更有效的聚类,其有效性和可行性适用于以聚类分析为目的的临床医学纵向数据的分析。(2)在临床医学纵向数据分析中,由于纵向数据的维度比较多,会加大建模的困难,所以在实际建模中,我们需要选择对病症影响比较大的特征来作为模型的输入。本文提出了基于GMDH算法的变量选择算法,考虑到该算法具有选择出与因变量密切相关的自变量的特点,本文将此方法用于临床医学纵向数据的变量选择中,这在本人所查阅的文献中尚未见到类似应用。通过在非小细胞肺癌纵向数据实验上的应用,可以得到该方法不仅能有效减少数据维度和算法复杂度,而且能保证有效的聚类结果。(3)针对纵向数据的特点,首先分析了多层线性模型在临床纵向数据处理上的一些的优点和局限性,无法分析随时间变化的指标对病症的影响,本文提出将纵向数据中时变的变量先进行聚类,然后再进行多层线性模型分析,进而改进了多层线性模型。然后,将改进后的模型应用到非小细胞肺癌纵向数据和妊娠高血压数据中,分析得到了病症的变化趋势,以及个体之间的差异性,为医生提供了一些诊疗建议。实验结果表明我们所提出的基于时变变量聚类的多层线性模型,能够解决时变变量不便在这类模型中作为自变量应用的现状。
其他文献
强烈的地震撕裂大地,吞噬一切。火山从地面升起,愤怒地宣泄极具破坏性的熔岩和灰烬,按“我”的意愿扭曲时空。这就是天神的力量,游戏中“我”就是天神。如果说前作那些神迹只是些
我国20世纪80年代兴建的钢结构广播电视塔,很多已经接近或超过设计使用年限,其中有部分铁塔在长期使用中维护不当,导致结构安全存在隐患,急需改造。本文从一个铁塔改造的工程
<正>遗传学中分离定律的异常比在高考的舞台上可谓是真正的高频考点,如2015年全国新课标卷Ⅰ第32题就考查了分离定律中的异常比,并与&#39;种群基因频率&#39;&#39;随机交配&#3
临床疗效评价是关系到中医学发展的重大科学问题,纵向数据是中医临床疗效的基本载体.本文针对中医临床中的纵向数据,应用隐马尔可夫模型进行了综合疗效评价.该方法能够整合多
汉语教育包括两方面:语言教育和汉字教育。语言教育解决怎么说的问题,汉字教育则是教如何写。书法的学习兼顾两个任务:汉字教育与艺术教育。以北京语言大学为例,学校两大主要
树立法治信仰是践行社会主义核心价值观、弘扬法治精神的最有力行动。理性对待中国优秀传统法制文化是树立法治信仰的重要环节。优秀的传统法治因素是树立现代法治信仰的根基