|
人类基因组中连锁不平衡(linkage disequiibrium, LD)的程度和分布情况在基因定位中极其重要,无论是作为复杂疾病精细定位时的工具,还是作为未来全基因组关联分析的基础。另外,连锁不平衡的知识还有助于有关人类的历史和起源,染色体重组等的研究。本节将从连锁不平衡的理论基础,如何应用在复杂疾病的研究中,这一方法存在的局限性,以及一些统计遗传软件的介绍来试图给出这一遗传疾病研究的重要工具的大概。 连锁不平衡分析的群体遗传学基础 连锁不平衡的含义 连锁不平衡又称等位基因关联(allelic association),其原理其实很简单。假定两个紧密连锁的位点1,2,各有两个等位基因(A,a; B,b),那么在同一条染色体上将有四种可能的组合方式:A-B,A-b,a-B,和a-b。假定等位基因A的频率为Pa,B的频率为Pb,那么如果不存在连锁不平衡(如组成单倍型的等位基因间相互独立,随机组合)单倍型A-B的频率就应为PaPb。而如果A与B是相关联的,单倍型A-B的频率则应为PaPb+δ,δ是表示两位点间LD程度的值。如果位点2上的等位基因B与疾病易患性有关,那么将会观察到等位基因A的频率在病人群体中高于对照群体。换句话说,等位基因A与该疾病性状相关。事实上,可以检测遍布基因组中的大量遗传标记位点,或者候选基因附近的遗传标记来寻找到因为与致病位点距离足够近而表现出与疾病相关的位点,这就是等位基因关联分析或连锁不平衡定位基因的基本思想。 产生和破坏连锁不平衡的因素 基因组中紧密连锁的基因位点在随机交配的群体中经过许多世代的重复交换而被随机化,出现了连锁平衡。概括地说,连锁不平衡可能有如下三个原因:1,被考察的群体来源于等位基因频率不同的群体,而且两个群体混合的时间不足以产生完全的随机化。2,两个基因位点之间的距离非常接近,以至于尚未经历足够的世代来被重组分开。3,某些连锁基因位点的等位基因的组合(单倍型)通过自然选择保持较高的频率。当由于以上原因群体开始偏离连锁平衡时,达到新的平衡所需的时间取决于基因位点间连锁的紧密程度:连锁越紧密,达到平衡的时间就越长。
|
|