在當今的世界中,語言的多樣性令人著迷,但它們之間的關聯性更加引人注意。語言學的研究顯示,許多現存的語言都是源自共同的祖先語言,這些共同的祖先語言被稱為「原語」或「祖語」。如此的語言家族概念,來源於生物學中的「家族」一詞,語言學家們以樹狀結構的模型來描繪語言之間的血緣關係。
語言家族通常至少包含兩種語言,然而有些語言孤立體—即與任何其他語言無關的語言,則偶爾也被描述為包含一種語言的家族。
這種語言的分歧通常是由於地理上的隔離造成的,形成不同地區的方言,這些方言經過時間的推移,發生不同的語音變化,最終演變為獨立的語言。以羅曼語族為例,西班牙語、法語、意大利語等都是來自於舊拉丁語的後裔,這樣的關係使得羅曼語族成為語言學中的知名案例。
音變是識別語言之間基因關係的強有力證據,因為其具有可預測和一致性質,並且可以通過比較法重建祖語。
然而,語言之間的接觸也可造成語言的變化,這可能會錯誤地顯示語言之間的基因關係。例如,蒙古語、滿語和突厥語在某種程度上顯示相似性,但這些相似之處最終被認為是由於語言接觸,而並非真正的基因關係。隨著語言接觸的加深,這種基因關係的識別變得愈加困難,甚至古阿非語系這其中最古老的示例之一,也遠比語言本身的歷史要年輕。
根據《民族語言學》,全世界的語言數量有7151種,分布在142個不同的語言家族中。語言學家Lyle Campbell確定有406個獨立的語言家族,這包括孤立語。當然,語言家族間的劃分並不簡單,因為它們的成員多數是通過歷史文獻直接記載的,像是羅曼語系的各種語言都是有據可循的。
語言數量的計數因方言劃分標準的不同而有顯著差異,這導致不同來源提供的語言數量相差甚遠。
例如,印度-歐洲語系包含了多種語言,從發源於古典拉丁語的西班牙語到源自古諾爾斯語的北日耳曼語言家族。這些語言的共同源頭是古印度-歐洲語,儘管我們無法直接獲得古印度-歐洲語的文本紀錄,語言學家們仍然可以透過比較法逐步重建出許多特徵。
在語言學中,當兩種語言都是由同一共同祖先衍生出來時,它們就擁有基因關係。此過程的深入理解需要對語言的演變進行仔細的分析。通過使用比較法,語言學家收集語言中推測是同根的詞彙,然後將類似詞彙進行對比。
一旦排除巧合且借詞的可能性,剩下的解釋就是共同起源,這暗示著這些語言必然存在基因關係。
然而,語言之間的接觸與借用並不等同於語言之間的基因關係。比如法語對英語的影響,雖然顯著,但並不意味著兩者有直接的基因聯繫。這種借用在短時間內並不影響語言的基本結構,卻可能誤導對語言起源的推測。
除了基本的語言家族模型,還有語言孤立和混合語言體例的例外。語言孤立是那些無法與任何其他現代語言確定關係的語言,這些語言可以被視為單一語言的家族。著名的例子包括巴斯克語,雖然這些語言通常被認為與人類語言的演化有著千絲萬縷的聯繫,但它們的密切關係至今仍然是語言學界的爭論焦點。
更為爭議的是單一起源論,它認為所有已知的語言都是源自於單一的祖先語。這一理論的真實性尚未確定,但若成立,則意味著語言間的聯繫更為深厚。這讓我們不禁思考:語言的演化究竟有多深的歷史根基,是否可以追溯到一個共同的語言起源?