在遗传学中,等位基因(allele)或称为等位型(allelomorph),是指在DNA分子的特定位点(或称基因座)上,核苷酸序列的变异形式。这些等位基因可以因单核苷酸多态性(SNP)而在单一位置上有所不同,还可以出现插入和缺失,长度可达数千个碱基对。当大多数等位基因对基因产物的功能不造成明显改变时,有些等位基因则会导致可观察的表现型特征变化,例如不同的颜色或外观。
一个经典的例子是,格雷戈尔·孟德尔发现豌豆花的白色和紫色颜色是由一个拥有两个等位基因的基因所造成的。几乎所有多细胞生物在其生物生命周期中某些时刻都是二倍体,即具有两组染色体。对于给定的基因座,若两条染色体含有相同的等位基因,则该生物在这些等位基因上是纯合子的,若等位基因不同,则是杂合子的。
流行的「等位基因」定义通常仅指基因中的不同等位基因。例如,ABO血型分组由ABO基因控制,该基因有六种常见等位基因(变异)。在群体遗传学中,几乎每位人类的ABO基因表现型都是这些六种等位基因的某种组合。
在很多情况下,两个等位基因之间的基因型相互作用可以描述为显性或隐性,具体取决于杂合子更像哪个纯合子。当杂合子无法与某个纯合子区分时,其表达的等位基因被称为「显性」等位基因,而另一个则为「隐性」等位基因。显性程度和模式在不同的基因座中有所不同。这种类型的互动首先由孟德尔正式描述。
然而,许多性状并不符合这种简单的分类,许多表现型由共显性和多基因遗传模型来解释。有时,「野生型」等位基因的术语被用来描述那些被认为有助于获得典型表现型的等位基因,如果蝇的「野生」群体等。
历史上,「野生型」等位基因被认为导致显性、常见和正常的表现型,而「突变」等位基因则导致隐性、稀有和常常有害的表现型。然而,现在明白大多数基因座都是高度多态的,拥有多种等位基因,且其频率在不同的群体中各异。
族群或物种的存在通常会在每个基因座中包含多个等位基因。基因型的频率也与特定等位基因的比例有关。某些基因变体,如null等位基因,就没有基因的正常功能,可能因为它们不被表达或表达的蛋白质是无活性的。
举例而言,人类的ABO血型碳水化合物抗原的基因座由三种等位基因IA、IB和i控制,这些等位基因决定了输血的相容性。每个个体拥有6种可能的基因型,而这些基因型产生4种可能的表现型:A型(由IAIA和IAi基因型产生)、B型(由IBIB和IBi基因型产生)、AB型(由IAIB基因型产生)及O型(由ii基因型产生)。如今已知每个A、B、O等位基因其实是一组不同的多个等位基因。
人类的ABO血型鉴定中,研究者发现,血型的多样性不仅仅归因于三个基本的等位基因。每个A、B、O等位基因各自还拥有超过70种的不同DNA序列所造成的多样性。
基因型的频率可以用来预测相对应的基因型频率,这一点可以根据哈迪-温伯格原理来理解。当某个基因座只有两个等位基因时,基因型的频率可以透过简单的比例来表示。
若有多个等位基因的情况下,在一个二倍体基因座上的可能基因型数量可以用一个公式呈现。那么要理解这些不同的等位基因所造成的影响与潜在风险,其实实际上是非常复杂的。
一些遗传疾病的形成是因为个体继承了两个隐性等位基因。隐性遗传疾病包括白化病、囊性纤维化等。此外,有些疾病甚至仅需一个显性等位基因就可造成遗传问题,如亨廷顿舞蹈病。
最后,尽管目前我们主要关注基因的遗传表现,事实上表观遗传学的标记如DNA甲基化,也可以在某特定基因组区域之间遗传。这种现象被称为转基因表观遗传遗传,显示了基因多样性的复杂性。
因此,我们不禁要思考:在如此多样的等位基因变异中,你是否能够认识到最能代表你自身特征的那一种呢?