Trong thế giới ngày nay, sự đa dạng của các ngôn ngữ thật hấp dẫn, nhưng mối liên hệ giữa chúng thậm chí còn đáng chú ý hơn. Nghiên cứu ngôn ngữ học cho thấy nhiều ngôn ngữ hiện có đều bắt nguồn từ các ngôn ngữ tổ tiên chung. Những ngôn ngữ tổ tiên chung này được gọi là "ngôn ngữ gốc" hoặc "ngôn ngữ tổ tiên". Khái niệm họ ngôn ngữ xuất phát từ từ “họ” trong sinh học. Các nhà ngôn ngữ học sử dụng mô hình cấu trúc cây để mô tả mối quan hệ họ hàng giữa các ngôn ngữ.
Các họ ngôn ngữ thường chứa ít nhất hai ngôn ngữ, mặc dù ngôn ngữ tách biệt—các ngôn ngữ không liên quan đến bất kỳ ngôn ngữ nào khác—đôi khi được mô tả là các họ có chứa một ngôn ngữ.
Sự khác biệt về ngôn ngữ này thường do sự cô lập về mặt địa lý, hình thành nên các phương ngữ ở các vùng khác nhau. Các phương ngữ này trải qua những thay đổi về ngữ âm khác nhau theo thời gian và cuối cùng phát triển thành các ngôn ngữ độc lập. Lấy các ngôn ngữ Lãng mạn làm ví dụ. Tiếng Tây Ban Nha, tiếng Pháp, tiếng Ý, v.v. đều là hậu duệ của tiếng Latinh cổ. Mối quan hệ này khiến các ngôn ngữ Lãng mạn trở thành một trường hợp nổi tiếng trong ngôn ngữ học.
Sự thay đổi âm thanh là bằng chứng mạnh mẽ để xác định mối quan hệ di truyền giữa các ngôn ngữ vì nó có thể dự đoán được và nhất quán, đồng thời cho phép tái tạo so sánh các ngôn ngữ tổ tiên.
Tuy nhiên, sự tiếp xúc giữa các ngôn ngữ cũng có thể gây ra những thay đổi trong ngôn ngữ, điều này có thể thể hiện sai mối quan hệ di truyền giữa các ngôn ngữ. Ví dụ, các ngôn ngữ Mông Cổ, Mãn Châu và Thổ Nhĩ Kỳ cho thấy sự tương đồng ở một mức độ nào đó, nhưng những điểm tương đồng này cuối cùng được cho là do tiếp xúc ngôn ngữ chứ không phải là mối quan hệ di truyền thực sự. Việc xác định các mối quan hệ di truyền như vậy ngày càng trở nên khó khăn khi sự tiếp xúc ngôn ngữ ngày càng sâu sắc, và thậm chí một trong những ví dụ lâu đời nhất về điều này, tiếng Afrikaner cổ, còn trẻ hơn chính ngôn ngữ này rất nhiều.
Theo "Ngôn ngữ học dân tộc học", trên thế giới có 7.151 ngôn ngữ, phân bố trong 142 họ ngôn ngữ khác nhau. Nhà ngôn ngữ học Lyle Campbell đã xác định được 406 họ ngôn ngữ riêng biệt, bao gồm cả các ngôn ngữ biệt lập. Tất nhiên, việc phân chia giữa các họ ngôn ngữ không hề đơn giản, bởi hầu hết các thành viên của chúng đều được ghi chép trực tiếp qua các tài liệu lịch sử, chẳng hạn như các ngôn ngữ khác nhau của họ ngôn ngữ Rôman.
Số lượng ngôn ngữ thay đổi đáng kể tùy thuộc vào tiêu chí phân loại phương ngữ, dẫn đến số lượng ngôn ngữ được cung cấp bởi các nguồn khác nhau rất khác nhau.
Ví dụ, họ ngôn ngữ Ấn-Âu bao gồm nhiều ngôn ngữ khác nhau, từ tiếng Tây Ban Nha, có nguồn gốc từ tiếng Latin cổ điển, đến họ ngôn ngữ Bắc Đức, có nguồn gốc từ tiếng Bắc Âu cổ. Nguồn gốc chung của các ngôn ngữ này là ngôn ngữ Ấn-Âu cổ đại, tuy chúng ta không thể trực tiếp thu được các ghi chép văn bản của ngôn ngữ Ấn-Âu cổ đại nhưng các nhà ngôn ngữ học vẫn có thể dần dần tái dựng lại nhiều đặc điểm thông qua phương pháp so sánh.
Trong ngôn ngữ học, hai ngôn ngữ có liên quan về mặt di truyền khi chúng có nguồn gốc từ cùng một tổ tiên chung. Để hiểu thấu đáo quá trình này đòi hỏi phải phân tích cẩn thận sự tiến hóa của ngôn ngữ. Bằng cách sử dụng phương pháp so sánh, các nhà ngôn ngữ học thu thập các từ trong một ngôn ngữ được cho là có cùng gốc, sau đó so sánh các từ tương tự.
Sau khi loại bỏ khả năng trùng hợp và từ mượn, lời giải thích còn lại là nguồn gốc chung, ngụ ý rằng các ngôn ngữ phải có quan hệ di truyền.
Tuy nhiên, sự tiếp xúc và vay mượn giữa các ngôn ngữ không tương đương với mối quan hệ di truyền giữa các ngôn ngữ. Ví dụ, mặc dù ảnh hưởng của tiếng Pháp đối với tiếng Anh là đáng kể nhưng điều đó không có nghĩa là có mối liên hệ di truyền trực tiếp giữa hai ngôn ngữ này. Kiểu vay mượn này không ảnh hưởng đến cấu trúc cơ bản của ngôn ngữ trong một khoảng thời gian ngắn nhưng có thể làm suy đoán sai lệch về nguồn gốc của ngôn ngữ.
Ngoài mô hình họ ngôn ngữ cơ bản, còn có những trường hợp ngoại lệ đối với phong cách ngôn ngữ tách biệt và ngôn ngữ lai. Ngôn ngữ biệt lập là những ngôn ngữ không có mối quan hệ nhất định với bất kỳ ngôn ngữ hiện đại nào khác và có thể được coi là một họ ngôn ngữ đơn lẻ. Các ví dụ đáng chú ý bao gồm tiếng Basque, và mặc dù những ngôn ngữ này thường được cho là có mối liên hệ chặt chẽ với sự phát triển của ngôn ngữ loài người, mối quan hệ chặt chẽ của chúng vẫn là nguồn tranh luận trong giới ngôn ngữ ngày nay.
Điều gây tranh cãi hơn nữa là lý thuyết đơn sinh, cho rằng tất cả các ngôn ngữ đã biết đều bắt nguồn từ một ngôn ngữ tổ tiên duy nhất. Tính xác thực của lý thuyết này vẫn chưa được xác định, nhưng nếu đúng, nó sẽ gợi ý mối liên hệ sâu sắc hơn giữa các ngôn ngữ. Điều này khiến chúng ta tự hỏi: Liệu nền tảng lịch sử của sự phát triển của ngôn ngữ có thể bắt nguồn từ một ngôn ngữ chung sâu đến mức nào?