论文部分内容阅读
研究背景和目的:
随着人类生活水平的逐步提高,脂肪肝的流行已日趋全球化,脂肪肝的患病率不但高居(10%~24%)而且呈增长态势,对人类健康构成巨大威胁。由于研究方法、对象选择、研究规模、地域、社会文化经济状况、遗传等差异,有关脂肪肝的研究报道不尽相同,例如,发达国家女性发病率高于男性,而发展中国家则是男性发病率高于女性或无差别;发达国家脂肪肝人群的糖尿病患病率很高,而发展中国家却低的多。我国属发展中国家,有关脂肪肝的研究多以体检人群为对象,缺乏以普通人群为对象的脂肪肝患病和病因学研究的流行病学数据,脂肪肝在我国究竟是一种怎样的现状,目前还没有系统的研究结论。
脂肪肝是一种遗传-环境-代谢应激性疾病,其发病机理目前尚不清楚。现有研究认为,与代谢相关的肥胖、高脂血症、II型糖尿病、高血压与脂肪肝相关,而年龄、性别、遗传、酒精、药物和毒物也是不可忽视的原因,但这些因素在脂肪肝中贡献大小尚不清楚,此外,上述影响因素的交互作用也少有涉及。
从统计分析层面讲,logistic回归是分析多因素影响的较为常用的方法,无论是独立因素还是交互效应,都在不同领域得到了广泛应用。logistic回归虽然有应用简便和适用范围广等优点,但未能够考虑变量间的层次结构以及相加作用,故所拟合模型未必最优或局部最优。
综上述,本研究试图通过对广东省普通人群的脂肪肝流行病学调查,了解广东省脂肪肝的患病水平,探索脂肪肝的危险因素,给出国内社区干预的重点人群。尝试应用多水平结构模型、广义相对危险度模型、条件和非条件logistic回归模型、叉生分析等方法,甄别独立因素和交互作用,获得高拟合度的最优模型,以寻求危险因素的更好解释,最终形成一种合理的、适用的统计分析策略,为病因学研究提供新的分析手段。
研究对象与方法:
脂肪肝患病率调查:以广东省7岁以上常住居民为对象,采用由市→区→街道/乡→居委/村→居民楼/队的多阶段分层随机整群抽样方法,以广州市为中心包括广东省三种类型的经济区域(经济较发达的珠江三角洲地区抽中惠州、经济居中间状态的粤东粤西两翼地区抽中湛江和相对较落后的山区抽中韶关),在地理位置上包括了广州市及东部、西部和北部等6个调查点共计3543人进行问卷、查体和实验室检查,调查内容包括一般情况、吸烟饮酒等个人行为、饮食状况、个人及家族病史、体格检查、肝脏B超及肝炎标记物检测等。
脂肪肝危险因素调查:采用现场1:1配对的方式,病例为现场B超确诊的脂肪肝患者,对照为性别相同、年龄相差不到5岁、居住在同一街道、职业比较相近的非脂肪肝的社区人群。对配对的人群(共405对)加做实验室血糖、血脂、肝功能的检测。
遗传基因多态性选样与检测:在现有数据中的第一个和第二个调查现场,在脂肪肝患者中采用随机抽样的方式,抽取90例脂肪肝患者进行基因检测;同时按照频数匹配的原则,抽取年龄相近的非脂肪肝社区人群(100例)作为对照。脂肪肝中排除药物性脂肪肝、酒精性脂肪肝,符合非酒精性脂肪肝标准。利用PCR-RFLP方法检测脂联素基因多态性。
数据管理与控制:采用EPIDATA3.0进行资料双份录入和核对,采用Excel2003对脂肪肝患病率进行标准化。
分析方法:用x2检验进行率的比较和分层分析(CMH)。单向有序资料的趋势检验采用线性趋势x2检验。B超检测脂肪肝质量控制一致性检验用Kappa值。以HardyWeinberg平衡检验确认样本的群体代表性,研究对象与基因遗传平衡规律的吻合度采用x2检验,基因频率采用基因计数法计算,基因型构成比和等位基因分布频率比较采用x2检验。两组均数差异性检验采用t检验或t检验(方差不齐),三组以上采用one-wayANOVA及给予方差分析的SNK检验;肥胖各指标对脂肪肝的重要性采用受试者诊断特征曲线(ROC曲线)。脂肪肝危险因素分析的配对数据采用条件logistic回归分析,而现场女性脂肪肝危险因素采用非条件logistic回归拟合。用多水平研究模型判断脂肪肝患病在不同群体中的独立性和层次结构性。用聚类等手段将连续性变量分组,并与自身哑变量拟合结果比较(-2LnL)检验logitP与连续性变量和等级变量的线性关系。利用比数Box-Cox幂转换的原理通过SAS中的GENMOD程序编程代替国内少见的GLIM软件作广义相对危险度模型拟合,结合叉生分析以及在logistic回归模型中直接加入交互项,判断危险因素的交互作用以及选择最优模型。采用方差膨胀因子(VIF)、容忍度(TOL)、条件指数以及方差分解比例等进行方程自变量的共线性诊断并对具有多重共线性的因子采用主成分分析提取公因子。利用Pearson残差、Deviance残差、杠杆统计量H以及SAS程序中备选命令“aggregatescale=”对异常值、杠杆值以及数据的过离散作出诊断。利用pearsonx2以及真实性评价(灵敏度和特异度)对模型的拟合效果作出判断。上述资料分析在SPSS15.0、SAS9.0以及MLwin2.02软件上完成。
结论:
1.广东省脂肪肝患病率较高,主要为非酒精性脂肪肝,经济收入较高而文化程度较低是广东省脂肪肝发病的重要危险因素,广东省脂肪肝社区干预的高危人群为文化程度较低的人群(特别是女性);
2.广东省普通人群尽管吸烟、饮酒状况不很严重,但大量不规则饮酒以及大量吸烟仍然与脂肪肝有关,应加强人群戒烟限酒的宣传;
3.清淡饮食习惯是脂肪肝的保护因素,在饮食中减少肥腻食品和辣味食品的摄入,同时加强豆浆/牛奶的摄入;
4.缺乏证据证明HBV感染是脂肪肝的危险因素,但如果脂肪肝并发HBV感染可能导致严重后果;
5.肥胖仍然是脂肪肝最重要的危险因素,BMI和腰围在预测脂肪肝过程中具有同等的作用,高于腰臀比的重要性,它们之间在脂肪肝发生中存在超相加交互作用。
6.脂联素基因外显子2的T45G基因多态性由T→G转换,特别是GG基因型可能具有脂肪肝遗传易感性,女性非肥胖者发生脂肪肝很可能与遗传因素(GG基因多态性)有关;
7.脂肪肝患病在不同群体中具有独立性(缺乏地理聚集性),年龄、BMI、腰围对脂肪肝的影响是非线性的,不宜直接引入logistic回归方程,否则会降低方程的拟合效果;
8.包含血液检测指标的配对资料共线性诊断各自变量之间存在较强的共线性,采用主成分分析提取14个独立而且包含主要信息的公因子;
9.广义相对危险度模型既可作为模型筛选的方法也可以进行交互作用研究,脂肪肝主要危险因素作用形式为超相加次相乘,传统logistic回归会低估危险因素的单独作用以及交互作用,同样代谢综合征各危险因素与脂肪肝的关系也会被低估。
10.传统脂肪肝危险因素如血压、空腹血糖、甘油三脂等,即使在logistic回归模型低估作用的情况下依然具有统计学意义,说明这些因素在脂肪肝发病中的重要性,而血压中的SBP比DBP可能更有意义。