Khái niệm về họ ngôn ngữ dựa trên mối quan hệ lịch sử giữa các ngôn ngữ khác nhau. Các họ ngôn ngữ được tạo thành từ nhiều ngôn ngữ, tất cả đều phát triển từ một ngôn ngữ tổ tiên chung. Thuật ngữ này được sử dụng giống như khái niệm "họ" trong sinh học và mô hình cây của nhà ngôn ngữ học cũng tương tự như cây phát sinh gen trong phân loại học tiến hóa. Do đó, các nhà ngôn ngữ học xem "ngôn ngữ con" trong các họ ngôn ngữ có liên quan đến di truyền. Quá trình lấy ngôn ngữ con từ ngôn ngữ gốc thường là do sự tách biệt về mặt địa lý. Các phương ngữ ở các vùng khác nhau trải qua những thay đổi ngôn ngữ khác nhau theo thời gian và cuối cùng trở thành ngôn ngữ độc đáo.
Ví dụ: nhóm ngôn ngữ Lãng mạn nổi tiếng bao gồm tiếng Tây Ban Nha, tiếng Pháp, tiếng Ý và tiếng Bồ Đào Nha, tất cả đều có nguồn gốc từ tiếng Latin thông tục.
Những hành động xấu chỉ ra rằng bản thân ngữ hệ Lãng mạn thuộc họ ngôn ngữ Ấn-Âu lớn hơn, bao gồm nhiều ngôn ngữ từ Châu Âu và Nam Á, tất cả đều được cho là có nguồn gốc từ một tổ tiên chung gọi là Proto-Indo -Châu Âu. Các họ ngôn ngữ thường chứa ít nhất hai ngôn ngữ và thậm chí cả các ngôn ngữ tách biệt—tức là các ngôn ngữ không liên quan đến bất kỳ ngôn ngữ nào khác—đôi khi được gọi là các họ chỉ chứa một ngôn ngữ. Ngược lại, không có giới hạn trên về số lượng ngôn ngữ mà một họ ngôn ngữ có thể chứa; ví dụ, các ngôn ngữ Nam Đảo bao gồm hơn một nghìn ngôn ngữ.
Nhiều ngôn ngữ có những đặc điểm chung có thể được sử dụng để xác định các thành viên của một họ ngôn ngữ.
Những thay đổi trong giọng nói là bằng chứng mạnh mẽ để xác định mối quan hệ di truyền vì chúng có những đặc tính nhất quán và có thể dự đoán được, có thể được sử dụng để tái tạo lại ngôn ngữ gốc thông qua các phương pháp so sánh. Tuy nhiên, sự tiếp xúc giữa các ngôn ngữ cũng có thể gây ra những thay đổi về ngôn ngữ khiến các học giả hiểu lầm rằng chúng có liên quan đến di truyền. Ví dụ, có nhiều điểm tương đồng giữa các ngôn ngữ Mông Cổ, Tungusic và Turkic, khiến một số học giả tin rằng chúng có liên quan với nhau. Nhưng sau này người ta phát hiện ra rằng những điểm tương đồng này là do tiếp xúc ngôn ngữ nên chúng không thực sự có liên quan với nhau. Ngay cả họ ngôn ngữ lâu đời nhất có thể chứng minh được, họ ngôn ngữ Phi-Á, về cơ bản cũng trẻ hơn nhiều so với chính các ngôn ngữ đó.
Các ước tính về số lượng nhóm ngôn ngữ trên thế giới rất khác nhau. Theo "Ethnologue", hiện có 7.151 ngôn ngữ của con người, được phân bổ trong 142 họ ngôn ngữ khác nhau. Lyle Campbell (2019) đã xác định được 406 ngữ hệ độc lập, bao gồm cả các ngữ hệ biệt lập. Theo "Ethnologue 27" (2024), các họ ngôn ngữ sau chứa ít nhất 1% tổng số ngôn ngữ đã biết:
Theo Glottolog 5.0 (2024), sau đây là danh sách các họ ngôn ngữ lớn, tổng cộng 7788 ngôn ngữ (không bao gồm ngôn ngữ ký hiệu, ngôn ngữ hỗn hợp và ngôn ngữ khó phân loại):
Số lượng ngôn ngữ có thể thay đổi đáng kể tùy thuộc vào cách sử dụng ngôn ngữ.
Trong các họ ngôn ngữ, việc thiết lập các mối quan hệ di truyền phụ thuộc vào quá trình biến đổi ngôn ngữ. Nếu hai ngôn ngữ là thành viên của cùng một họ ngôn ngữ thì phải là do chúng có nguồn gốc từ cùng một ngôn ngữ tổ tiên chung. Việc thiết lập khái niệm này được thể hiện rõ ràng trong các ghi chép lịch sử của một số ngôn ngữ nhất định, chẳng hạn như các ngôn ngữ Lãng mạn, có các thành viên đều bắt nguồn từ tiếng Latinh. Mặc dù mối quan hệ di truyền của một số ngôn ngữ chưa được chứng minh trực tiếp trong hồ sơ; ví dụ, các ngôn ngữ Lãng mạn và Bắc Đức có liên quan với nhau và đều là phân họ của Ấn-Âu, bằng chứng cho Proto-Indo-European. không được bảo tồn.
Sự tiếp xúc giữa các ngôn ngữ có thể dẫn đến việc các ngôn ngữ ảnh hưởng lẫn nhau, dù thông qua vay mượn hay các phương tiện khác. Ví dụ, ảnh hưởng của tiếng Pháp đối với tiếng Anh, ảnh hưởng của tiếng Ả Rập đối với tiếng Ba Tư, v.v. Hình thức ảnh hưởng này không tương đương với mối quan hệ di truyền giữa các ngôn ngữ.
Mặc dù việc tiếp xúc bằng ngôn ngữ có thể dẫn đến ảnh hưởng lẫn nhau giữa các ngôn ngữ nhưng điều này không phải là dấu hiệu của mối quan hệ di truyền.
Trước sự đa dạng và phức tạp của ngôn ngữ, cấu trúc của các họ ngôn ngữ không phải là tuyệt đối. Đặc biệt dưới tác động của một số yếu tố đặc biệt nhất định, một số ngôn ngữ có tính độc lập với sự phân loại của các ngôn ngữ khác, hình thành nên sự cô lập về ngôn ngữ. Theo thống kê từ Glottolog, trên thế giới hiện nay có tổng cộng 423 ngữ hệ, trong đó có 184 ngữ hệ là ngôn ngữ biệt lập. Ví dụ, tiếng Basque là một ngôn ngữ biệt lập.
Khi thảo luận về sự tiến hóa và tiếp xúc của ngôn ngữ, chúng ta có nên hiểu sâu hơn về nguồn gốc tồn tại của ngôn ngữ không?