在当今的世界中,语言的多样性令人着迷,但它们之间的关联性更加引人注意。语言学的研究显示,许多现存的语言都是源自共同的祖先语言,这些共同的祖先语言被称为「原语」或「祖语」。如此的语言家族概念,来源于生物学中的「家族」一词,语言学家们以树状结构的模型来描绘语言之间的血缘关系。
语言家族通常至少包含两种语言,然而有些语言孤立体—即与任何其他语言无关的语言,则偶尔也被描述为包含一种语言的家族。
这种语言的分歧通常是由于地理上的隔离造成的,形成不同地区的方言,这些方言经过时间的推移,发生不同的语音变化,最终演变为独立的语言。以罗曼语族为例,西班牙语、法语、意大利语等都是来自于旧拉丁语的后裔,这样的关系使得罗曼语族成为语言学中的知名案例。
音变是识别语言之间基因关系的强有力证据,因为其具有可预测和一致性质,并且可以通过比较法重建祖语。
然而,语言之间的接触也可造成语言的变化,这可能会错误地显示语言之间的基因关系。例如,蒙古语、满语和突厥语在某种程度上显示相似性,但这些相似之处最终被认为是由于语言接触,而并非真正的基因关系。随着语言接触的加深,这种基因关系的识别变得愈加困难,甚至古阿非语系这其中最古老的示例之一,也远比语言本身的历史要年轻。
根据《民族语言学》,全世界的语言数量有7151种,分布在142个不同的语言家族中。语言学家Lyle Campbell确定有406个独立的语言家族,这包括孤立语。当然,语言家族间的划分并不简单,因为它们的成员多数是通过历史文献直接记载的,像是罗曼语系的各种语言都是有据可循的。
语言数量的计数因方言划分标准的不同而有显著差异,这导致不同来源提供的语言数量相差甚远。
例如,印度-欧洲语系包含了多种语言,从发源于古典拉丁语的西班牙语到源自古诺尔斯语的北日耳曼语言家族。这些语言的共同源头是古印度-欧洲语,尽管我们无法直接获得古印度-欧洲语的文本纪录,语言学家们仍然可以透过比较法逐步重建出许多特征。
在语言学中,当两种语言都是由同一共同祖先衍生出来时,它们就拥有基因关系。此过程的深入理解需要对语言的演变进行仔细的分析。通过使用比较法,语言学家收集语言中推测是同根的词汇,然后将类似词汇进行对比。
一旦排除巧合且借词的可能性,剩下的解释就是共同起源,这暗示着这些语言必然存在基因关系。
然而,语言之间的接触与借用并不等同于语言之间的基因关系。比如法语对英语的影响,虽然显著,但并不意味着两者有直接的基因联系。这种借用在短时间内并不影响语言的基本结构,却可能误导对语言起源的推测。
除了基本的语言家族模型,还有语言孤立和混合语言体例的例外。语言孤立是那些无法与任何其他现代语言确定关系的语言,这些语言可以被视为单一语言的家族。著名的例子包括巴斯克语,虽然这些语言通常被认为与人类语言的演化有着千丝万缕的联系,但它们的密切关系至今仍然是语言学界的争论焦点。
更为争议的是单一起源论,它认为所有已知的语言都是源自于单一的祖先语。这一理论的真实性尚未确定,但若成立,则意味着语言间的联系更为深厚。这让我们不禁思考:语言的演化究竟有多深的历史根基,是否可以追溯到一个共同的语言起源?