论文部分内容阅读
背景HIV职业暴露感染及医源性感染的风险受到医务人员、公安干警和公众的高度关注。传统的HIV暴露后感染溯源调查主要依赖于流行病学调查和文件记录,其中HIV职业暴露管理相对规范,要求对暴露人定期随访检测HIV抗体,以监测是否在一定期限内发生HIV抗体阳转。然而,在特殊情况下,HIV抗体阳转的证据不足以认定本次感染来自职业暴露,比如暴露人在暴露前已感染HIV但处于检测窗口期而未被发现,或暴露后随访期内又发生了可能感染HIV的其他高危行为,这就需要进一步做分子生物学检测,包括病毒基因亚型和准种分析。由于缺乏类似职业暴露管理的报告和文件记录体系,HIV医源性感染的溯源调查更加困难,对分子生物学证据的需求也更为迫切。已报道的HIV分子溯源技术主要有PCR产物直接测序法、PCR产物克隆法和终点有限稀释PCR法,用于分析暴露源和暴露人体内HIV毒株间的关系。前者操作较简便,但只能检出个体内HIV优势准种的核酸序列:后两者可以获得多条优势及弱势准种序列,本实验室曾将它们成功地应用于HIV感染溯源调查,但这两种方法的不足之处是操作比较繁琐。Illumina公司的Miseq高通量测序平台(以下简称Miseq测序)能够将PCR产物简单处理后直接测序,一次反应获得大量的核酸序列信息,已应用于丙型肝炎病毒的耐药突变检测等研究中。目前国内外尚未见有将该方法应用于HIV准种分析或溯源调查的报道。目的1、建立基于Miseq测序技术的HIV准种分析方法,并探索其用于HIV感染溯源调查的条件;2、将该方法用于一个疑似HIV传播链的溯源调查。材料和方法1、研究对象:(1)本实验室保存的一个疑似HIV传播链上的3例HIV感染者(编号T1~T3)血样及部分对照血样。相关流行病学背景如下:T3通过男男同性性行为将HIV传播给T2,T2通过献血将HIV传播给T1。选用了11份对照样品(编号C3~C13),其中C3-C6与T1生活在同一城市,C7-C13与T2、T3生活在另一城市。(2)在上述对照样品中,C6和C5疑似有传播关系(C5通过异性性接触将HIV传播给C6),本研究首先利用这2份样品及其对照(C3、C4)进行方法学研究,然后再扩大范围,研究其他样品间的传播关系。2、实验方法:(1)从血浆样品中提取RNA,并逆转录为cDNA.或者从全血样品中提取总核酸,并进行逆转录反应。(2)PCR产物直接测序:分别针对env.gag和pol基因区进行PCR扩增,产物纯化后直接测序。(3)筛选Miseq测序的目的片段,设计、优化通用引物序列。(4)Miseq测序所需的第二轮下游引物为融合引物,每份样品各不相同,分别优化PCR反应条件,再进行PCR扩增。(5)PCR产物纯化、质量评估后构建基因文库。(6)利用Miseq测序,进行初步数据处理。(7)对获得的准种序列进行系统进化分析。结果1、方法学研究(使用样品C3-C6)(1)PCR产物直接测序:4份样品3个基因区均扩增、测序成功,env、pol和gag基因区的样品间基因离散率分析均显示C6与C5间亲缘关系较近,但无法获得关于传播方向的信息。使用env基因区所获得的样品间基因离散率明显大于pol和gag基因区,能够提供更多的进化信息。(2)Miseq测序结果:4份样品均测序成功,获得的平均有效序列数为29045(23788-37397)条,平均代表1314(1229~1412)个独特准种。4份样品均存在准种序列的频率由高到低迅速递减的特点,频率最高(最优势)的前20个准种序列占HIV准种群总序列数的比例在41.5%~66.2%之间。(3)样品间基因离散率分析:针对每份样品,分别选取最优势的前5、20、100、500个及全部准种序列进行分析。当取最优势的前5个准种序列时,C6与C5间的平均基因离散率为4.2%,低于C6与C3间(11.6%)、C6与C4间(18.2%),差异都有统计学意义(P<0.01);而除C6以外的其他样本间平均基因离散率都在10%以上。当取最优势的前20、100、500个或者全部准种序列时,所得结果相似,都提示C6与C5间亲缘关系较近。(4)系统进化树分析:当取最优势的前5个准种序列分析时,C5和C6的准种序列聚为一簇,C3和C4的准种序列各自聚为一簇;C5与C6的准种间呈并列关系,不能提示传播方向。当取最优势的前20个或更多准种序列时,分析结果相似,不同之处是C5的部分准种包裹着C6的全部准种,即C5对C6存在并系关系(paraphyletic relationship),提示HIV传播的方向是从C5到C6;纳入分析的准种数越多,这种并系关系越加明显。2、方法学应用:Miseq测序用于一个疑似HIV传播链的溯源调查(使用样品T1~T3,C7~C13)(1)Miseq测序结果:1份样品(C10)的测序结果质量较差,弃去;其余9份样品(T1-T3, C7-C9, C11-C13)测序成功,获得的平均有效序列数为22685(8637~37865)条,代表平均999(553~1660)个独特准种。9份样品均存在准种序列的频率由高到低迅速递减的特点,频率最高(最优势)的前20个准种序列占HIV准种群总序列数的比例在41.5%~68.9%之间。(2)样品间基因离散率分析:每份样品均取最优势的前100个准种序列。T1与T2间的平均基因离散率(2.8%)、T2与T3间的平均基因离散率(2.9%)分别小于T1、T2与其他对照间的平均基因离散率(3.6%~14.0%、3.1%~13.6%,P<0.01)。C12与T1、T2和T3间的基因离散率也较小,亲缘关系较近。(3)系统进化树分析:每份样品均取最优势的前100个准种序列。T1、T2、T3和C12的准种序列聚为一簇,其余样品的准种序列各自聚为一簇。T3对T1、T2、C12存在并系关系,T2对T1存在并系关系,支持HIV由T3传播给T2、再由T2传播给T1的流行病学调查结果。然而,由于缺乏完整的流行病学信息,C12与T3间的传播关系无法确定,但他们同属于MSM人群,且居住地较近,T3直接或间接地将HIV传播给C12的可能性较大。(4)Miseq测序所得有关HIV亲缘关系及传播方向的结论与本实验室前期使用PCR产物克隆法和EPLD-PCR法检测获得的结论相符。结论1、建立了基于Miseq测序技术的HIV准种分析方法。2、Miseq测序结果可用于推断HIV感染者之间的亲缘关系;对于有传播关系的感染者样品,当所用优势准种的数量达到一定程度时,可有效判定HIV的传播方向,所用的优势准种数越多,结果越明显。3、对1个经性传播链和1个经性-输血传播链的分子溯源调查表明,Miseq测序结果都能有效支持相关的流行病学调查结果。但当流行病学资料不完整时,实验室数据应谨慎解读。4、Miseq测序技术操作较简便、检测成本较低,在HIV溯源调查中具有较高的实用价值。