缺血性卒中现已成为导致成年人残疾和死亡的主要疾病之一,给经济和社会带来沉重负担。其病因复杂,除年龄、性别、高血压、糖尿病和吸烟等危险因素外,还具有明显的遗传倾向性。近年来,基因组学在冠心病、高血压、糖尿病等多种常见的复杂性疾病研究中取得了显著进展,并显示其中一些参与了心血管病和代谢功能的基因突变,如血管紧张素转换酶(angiotensin converting enzyme,ACE)基因插入或缺失突变以及载脂蛋白E(apolipoprotein E,ApoE)基因突变产生的ε2、ε3、ε4等位基因,也可能与缺血性卒中有关。然而,由于缺血性卒中具有异质性,既可能由单一危险因素所致,也可能由遗传和环境等多种危险因素协同作用所致,故发病机制更加复杂,至今尚未明确证明一种易感基因是其遗传致病因素。尽管如此,目前的遗传学和基因组学研究仍然表明,基因多态性在缺血性卒中流行病学、病因学、病理生理学以及预防、诊断和治疗中具有重要意义。现就近年来缺血性卒中的基因组学研究进展做一综述。
1 缺血性卒中基因组学研究的常用方法
单核苷酸多态性(single nucleotide polymorphism.SNP)是研究基因突变和遗传性疾病的最常用方法。每个SNP代表一个碱基变化,现已知人约有120万个SNP,它们编码或不编码,影响蛋白质的表达和功能。由于相邻SNP常常连锁不平衡,因此如果将某个SNP进行基因分型,便能作为一种标记物为临近的SNP提供遗传信息。在全基因组学研究兴起之前,研究人员主要利用基于SNP的连锁分析和候选基因关联研究识别缺血性卒中的遗传基因,并取得了一定成果。
随着人类全基因组图谱的完成和计算机高通量技术的应用,缺血性卒中的遗传机制研究很快转向全基因组扫描研究,如全基因组连锁分析(gnome-wide lineage analysis)和全基因组关联研究(genome-wide association study,GWAS)。目前,GWAS和生物信息学的综合运用是缺血性卒中基因组学研究的最主要方法。此外,研究人员还通过结构遗传变异、基因转录水平变异以及表观遗传学水平变异等结构基因组学和(或)功能基因组学研究方法,从基因的不同水平和层次进一步阐明缺血性卒中的遗传机制。
2 缺血性卒中基因组学的主要研究结果
2.1 单基因遗传性缺血性卒中
缺血性卒中的遗传学研究分为2类——单基因遗传和多基因遗传。目前将患者年龄<50岁,无高血压、高血脂和糖尿病等常见危险因素,且已明确基因突变并遵循孟德尔遗传定律的缺血性卒中定义为单基因遗传性缺血性卒中。虽然这种类型的缺血性卒中仅占全部卒中类型的1%,但其研究结果可靠,能为多基因遗传性缺血性卒中的研究提供重要线索。
伴皮质下梗死和脑白质病的常染色体显性遗传性脑动脉病(cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy,CADASIL)是最常见的外显率较高的单基因缺血性卒中,临床呈反复发作的皮质下梗死、有先兆型偏头痛、进行性认知损害和出现精神症状。CADASIL患者在位于人染色体19p13.1区域的Notch3基因发生缺失性突变,这一发现为临床筛查和诊断CADASIL提供了依据,并制备出CADASIL转基因小鼠。然而,Notch3基因通过何种机制诱发卒中的作用机制仍不清楚,可能由于Notch3基因突变,使其蛋白表达水平发生改变,引起血管平滑肌肌动蛋白骨架形成异常,导致小动脉管壁变厚和纤维化,血管内皮细胞损害以及脑血管自动调节功能障碍,从而诱发卒中。
法布雷病(Fabry disease)是青年卒中的主要病因之一,呈X连锁隐性遗传,由于α-半乳糖苷酶基因突变引起酶部分或完全缺乏,造成糖脂、球形三脂酰基鞘氨醇聚积在不同器官的细胞膜和溶酶体而致多脏器损害。既可影响大动脉,亦可累及小血管,多见后循环脑梗死和白质病变。研究表明,法布雷病与白细胞介素(interleukin,IL)-6墓因多态性、内皮型一氧化氮合酶、V因子和Z蛋白有关,但确切机制有待深入研究。
镰状细胞病(sickle cell disease,SCD)是儿童卒中的常见病因,呈常染色体隐性遗传,由于β-球蛋白基因点突变使血红蛋白B链N末端的谷氨酸被缬氨酸替代,形成异常血红蛋白S。SCD主要累及大动脉,表现为可逆性脑白质病、脑静脉血栓形成以及颅内和蛛网膜下腔出血,以分水岭梗死较为多见,累及小动脉时可造成皮质下小梗死灶。
Sebastiani等的研究显示,胎儿血红蛋白与细胞间黏附分子、P-选择素以及转化生长因子-β-信号通路基因相互作用,调控卒中的发病风险,提示修饰基因多态性在单基因病中具有重要作用,也为多基因卒中的遗传机制研究提供了线索。
其他单基因遗传缺血性卒中包括常染色体显性淀粉样蛋白血管病、线粒体脑肌病伴高乳酸血症和卒中样发作(mitochondrial encephalomyopathy,lacticacidosis,and Stroke-like episodes,MELAS)综合征、高胱氨酸尿、Ehler-Danlos综合征、马凡综合征和Maeda综合征等。利用基因组学研究方法,这些疾病的染色体定位和(或)致病基因均已被识别(表1)。
2.2 多基因遗传缺血性卒中的基因组学研究
大部分缺血性卒中不是由1个或几个易感基因所致,而是由基因一基因和(或)基因一环境危险因素共同作用引发的多基因和多因素疾病,单个易感基因对表型的影响很小(相对危险度1.2~1.5)。近年来业已发现许多与缺血性卒中密切相关的功能性SNP或候选基因及其染色体定位(表2)。
表1 单基因遗传缺血性卒中的染色体区域或致病基因
CADASIL:伴皮质下梗死和脑白质病的常染色体显性遗传性脑动脉病;HERNS:伴视网膜病、肾病、卒中的遗传性内皮细胞病;SCD:镰状细胞病;MELAS:线粒体脑肌病伴高乳酸血症和卒中样发作
表2 多基因遗传缺血性卒中的易感染色体区域(相关基因)及基因功能
1996年,Rubattu等最早通过对易卒中型自发性高血压大鼠进行研究证明,3个与心房和脑利钠肽基因连锁的数量性状遗传位点-STR1~3是独立于原发性高血压因素之外的复杂型卒中的遗传致病因素。2007年,Matarin等首次利用GWAS研究检测缺血性卒中的易感基因,尽管未发现任何单个区域与缺血性卒中明显相关,但仍筛选出一些有意义的SNP,且它们大多定位于已知热点候选基因位点或邻近位点。随后,Bersano等对众多已知缺血性卒中候选基因进行评估发现,编码因子V、因子Ⅱ、ApoE、纤溶酶原激活抑制物-1、血小板受体GPIBA、ACE和亚甲基四氢叶酸还原酶的基因与卒中风险显著相关。此外,Meschia等还在缺血性卒中同胞研究中发现,患病组染色体3p和6p处有SNP聚集,包括一氧化氮合酶基因,且与卒中发病年龄有关,提示一氧化氮合酶基因多态性参与了缺血性卒中的发病。这些结果表明,影响缺血性卒中的遗传易感基因的数量和频率在群体水平分布十分广泛。值得注意的是,这些基因主要与肾素一血管紧张素-醛固酮系统、凝固和止血、炎症、同型半胱氨酸代谢、脂代谢、内皮细胞功能和细胞外基质功能等有关。缺血性卒中基因组学研究取得的重大进步是在冰岛人群的家系研究中发现了染色体5q12区域的磷酸二酯酶4D(phosphodiesterase 4D,PDE4D)基因突变与缺血性卒中相关。PDE4D属于降解环磷酸苷酸(cyclic adenosine monophosphate,cAMP)的磷酸二酯酶超家族。cAMP在平滑肌细胞和巨噬细胞的增殖中起着重要作用,参与动脉粥样硬化形成,并影响斑块稳定性。目前,PDE4D基因多态性在缺血性卒中发病中的分子机制尚不清楚。不过,研究显示,我国汉族人群PDE4D(83T/C)CC基因型和C等位基因与缺血性卒中的发病风险增高有关。Nilsson-Ardnor等对曾被用来进行过PDE4D重复性研究的遗传变异较低的家系进行研究发现,除位于染色体5q的卒中易感位点之外,还存在许多易感性较低的卒中遗传位点。还有研究显示,位于染色体13 q12区域的5-脂氧合酶激活蛋白(5-lipoxygenase activating protein,ALOX5AP)基因是诱发卒中和心肌缺血的易感位点,而且一个常见SNP(rs17222919)使中国东部人群缺血性卒中风险增高1.34倍,在小动脉闭塞性卒中和女性中更为显著。ALOX5AP参与白三烯通路,一直被认为是动脉粥样硬化的危险因素,提示ALOX5AP可能通过增强炎症反应和加速动脉粥样硬化来促进卒中发生。此外,其他白三烯通路的基因变异体,如白三烯A4水解酶和白三烯B4受体BLT1和BLT2区域也可能与卒中相关。
另外,许多研究显示,缺血性卒中各亚型的致病基因存在差异。Debette等的研究显示,SNP(rs2208454)与无卒中发作史的原因不明性梗死有关,其位于染色体20p12区域MACRO结构域的3号内含子,包括2个位于纤连蛋白富有亮氨酸跨膜蛋白3基因(fibronection leucine-rich transmembrane protein 3 gene,FLRTP3)的下游区域基因。Kubo等的研究显示,一个蛋白激酶C家族的SNP——PRKCH与腔隙性梗死风险显著相关。Ikram等的研究显示,位于染色体12p13区域靠近NINJ2和WNK1基因的2个常见SNP与局部缺血,尤其是动脉粥样硬化性卒中相关。Gretarsdottir等的研究显示,位于染色体4q25区域的转录激活子PITX2基因附近有2个相邻的SNP与心源性脑栓塞显著相关。此外,Gudbjartsson等还发现,位于染色体16q22区域编码同源结构域锌指蛋白的ZFHX3基因也与心源性脑栓塞有关。由于PITX2和ZFHX3基因被认为是心房颤动的危险因素,因此这2项研究结果提示,某些与心血管病相关的基因突变是心源性脑栓塞的危险因素。另有研究显示,9号染色体突变与心肌梗死和冠状动脉疾病相关。Anderson等的进一步研究显示,9p21区域的CDNK2A和CDNK2B基因与大动脉粥样硬化性卒中有关。如果靶向敲除小鼠4号染色体上的同源性70 kD非编码间隔,其附近的心脏和血管细胞的基因特性可发生改变,表明9p21区域在调节心脏CDKN2A/B表达和影响冠心病和缺血性卒中进展方面起着关键作用。
目前,多基因遗传缺血性卒中的结构基因组学和功能基因组学研究正在如火如荼地展开。拷贝数变异(copy number variants,CNV)属于结构基因组学范畴,指长片段DNA(>1 000 bp)的重复和缺失,进而导致基因贮积、结构改变或截短,最终影响基因功能。Matarin等采用基于高密度SNP分析对263例缺血性卒中患者和275名正常对照者进行研究发现了247个CNV,包括187个插入突变和60个缺失突变,提示CNV能增高缺血性卒中的发病风险。CNV等基因突变还能引起转录和蛋白表达水平的改变,进而影响疾病的表型。Mitsios等在卒中发病后2~6 d、9~20 d和26~37 d分别建立了3个mRNA、表达谱,分别发现77、92和15个基因在卒中患处表达下调,表明基因表达会随着卒中进程而出现动态性改变,并首次发现3个基因(PAK1、MMP11和INI1)与卒中显著相关。Liu等还对大鼠大脑中动脉闭塞(middle cerebral artery occlusion,MCAO)后微小RNA(microRNA,miRNA)变化水平进行了研究,结果显示,一组miRNA(mo-miR-140、mo-miR-143、mo-m1R-204等)发生双向表达改变,从而导致急性损伤和恢复延迟,提示miRNA水平改变也与缺血性卒中有关。此外,有研究提示,增加雌激素受体α(estrogen receptor α,ERα)启动子甲基化在动脉粥样硬化和血管老化中起着作用。Lee等[38]的研究显示,MCAO能使Na+-K+-2Cl-共转运体1(Na+-K+-2Cl-co-transporter type 1,NKCC1)基因启动子甲基化减少,从而导致NKCC1表达上调,继而引起神经元损伤,表明DNA甲基化可能参与了缺血性卒中的病理学过程。这些结果提示,DNA甲基化、组蛋白转录后修饰和高位染色体重塑等在缺血性卒中的进展和易感性中起着重要作用。
除缺血性卒中的易感基因研究外,药物基因组学和影响卒中预后的基因组学研究也取得了一定的进展。氯吡格雷能降低缺血性卒中的复发风险,细胞色素P450酶(cytochrome P-450,CYP)能将其转化为活性代谢产物。CYP2C19等位基因功能降低可使卒中发病风险增高53%。此外,Westbroek等的研究证实,脑源性神经营养因子基因(va166met)多态性与运动诱发电位波幅增加较小和运动皮质分布重组有关,va166met突变预示卒中患者预后较差。这些研究将为临床医生进行个性化治疗提供帮助。
3 存在的问题与展望
虽然缺血性卒中的基因组学研究发展迅猛,但仍任重而道远,主要原因可能包括:(1)起病较晚,难以收集到大的家系;(2)不同种族、不同人群、不同发病年龄及不同表型的发病机制可能不同;(3)不同的基因突变可能导致同样的表型或一些继承了易感等位基因的个体没有发病或一些没有继承易感等位基因的个体由于随机或环境原因仍出现缺血性卒中,以致发病机制非常复杂;(4)并存高血压、冠心病、糖尿病等混杂因素,易感基因可能直接或间接与环境暴露因素相互作用,导致单个基因的作用很难估计;(5)常见的基因突变本身不引起卒中易感性增高,每个基因对整个遗传的影响很小,并且样本量小,统计效能不足,因此只能检测常见的SNP,而检测不到罕见的SNP,很多结果为假阳性;(6)临床诊断不确切,缺乏血液学诊断指标,不同样本分层的研究结果可能不一致。因此,至今仍很难明确任何1个或多个缺血性卒中的致病基因。
将来,研究人员首先要对缺血性卒中进行正确的分型,进行严格的病例对照匹配,以使非研究因素在病例组和对照组之间甚至不同人群间尽可能一致,如可通过“表型组学”改善卒中表型的宽度和辨别,降低临床异质性等。此外,多个研究中心的合作将有利于获得足够大的样本量和统计效能,从而保证基因组学研究结果的可靠性。危险因素评分也可能对预测卒中有用。我们相信,随着大量创新性分子生物学技术和生物信息学技术的出现,以及卒中分型准确性的提高、全球范围内多中心和大样本临床合作等,基因组学研究有可能最终帮助我们寻找到对缺血性卒中的诊断、治疗和评估具有重要价值的生物学标记物。