论文部分内容阅读
目的针对出生缺陷调查数据“异质性、高维度、关系复杂和变量属性不同”的特点以及传统的卡方检验与logistic回归分析方法无法挖掘出出生缺陷众多交错复杂因素的整体效应等问题,引入潜在类别模型,研究出生缺陷人群高危因素分布特征,挖掘出生缺陷危险因素,为出生缺陷病因学研究和防控干预策略制定提供理论基础和方法支持。方法以山西省人口计生委科学研究所对山西省6个县(市)2006-2008所有的出生儿母亲及其家属调查的数据为例,6个县(市)分别为平定县、代县、汾阳市、怀仁县、中阳县和交口县,调查母亲总人数为36716例,其中分娩出生缺陷儿的母亲总数为493例,同时,对照儿童(正常儿)与出生缺陷儿童按1:1比例配对,要求同一年内出生,且父母生活条件相似。采用潜在类别模型,找出生缺陷组和对照组的高危因素分布特征。首先,通过探索性潜在类别分析得出两组的最优潜在类别模型;然后,应用验证性潜在类别分析,检验探索性潜在类别分析结果是否正确;最后对潜在类别分析的所有结果进行对比与讨论。结果探索性潜在类别分析结果:出生缺陷组选择6-cluster模型为最优潜在类别模型,六个潜在类别依次可命名为遗传因素型(25人)、预防措施缺乏型(102人)、危险因素较多型(12人)、母亲相关危险因素型(100人)、母亲孕期有感冒发热或服药史型(36人)和危险因素较少型(218人)。对照组选择3-cluster模型为最优潜在类别模型,三个潜在类别依次可命名为预防措施缺乏型(132人)、危险因素较少型(328人)和母亲孕期有服药史型(33人)。验证性潜在类别分析的结论均支持探索性潜存类别分析的结果。结论与对照组相比,出生缺陷组的最优潜在类别模型多了三个潜在类别,分别为遗传因素型、危险因素较多型和母亲相关因素型。潜在类别模型利用较少的潜类别,解释多个外显分类变量之间的复杂关联,这一优势在研究出生缺陷人群的高危因素分布特征时有很好的体现。