O conceito de família linguística é baseado na relação histórica entre várias línguas. Uma família linguística é composta por múltiplas línguas que evoluíram de uma língua ancestral comum. O termo é usado de forma muito semelhante ao conceito de "família" na biologia, e o modelo de árvore dos linguistas é semelhante à árvore filogenética na taxonomia evolutiva. Os linguistas, portanto, consideram que as "línguas filhas" dentro de uma família linguística são geneticamente relacionadas. O processo de derivação de línguas filhas de uma protolíngua geralmente ocorre devido à separação geográfica, com dialetos em diferentes regiões passando por diferentes mudanças linguísticas ao longo do tempo e eventualmente se tornando línguas únicas.
Por exemplo, a conhecida família das línguas românicas inclui o espanhol, o francês, o italiano e o português, todos descendentes do latim vulgar.
A própria família das línguas românicas faz parte da maior família das línguas indo-europeias, que inclui muitas línguas da Europa e do Sul da Ásia que se acredita terem descendido de um ancestral comum chamado proto-indo-europeu. As famílias linguísticas geralmente contêm pelo menos duas línguas, embora até mesmo línguas isoladas — isto é, línguas não relacionadas a nenhuma outra língua — sejam às vezes chamadas de famílias que contêm apenas uma língua. Por outro lado, não há limite máximo para o número de línguas que uma família linguística pode conter; por exemplo, o austronésio contém mais de mil línguas.
Muitas línguas têm características comuns que podem ser usadas para identificar membros de famílias linguísticas.
Mudanças sonoras são fortes evidências para identificar relações genéticas porque são previsíveis e consistentes e podem ser usadas para reconstruir a língua original por meio de métodos comparativos. No entanto, o contato entre línguas também pode causar alterações linguísticas, o que pode induzir os pesquisadores a acreditarem erroneamente que há uma relação genética entre elas. Por exemplo, há muitas semelhanças entre as línguas mongol, tungúsica e turca, levando alguns estudiosos a acreditar que elas são relacionadas. Mas mais tarde foi descoberto que essas semelhanças eram devidas ao contato linguístico, então elas não eram realmente relacionadas. Mesmo a mais antiga família linguística comprovada, a afro-asiática, é, em essência, muito mais jovem do que as próprias línguas.
As estimativas do número de famílias linguísticas no mundo variam muito. De acordo com o Ethnologue, existem 7.151 línguas humanas, distribuídas em 142 famílias linguísticas diferentes. Lyle Campbell (2019) identifica 406 famílias linguísticas distintas, incluindo isoladas. De acordo com o Ethnologue 27 (2024), as seguintes famílias linguísticas contêm pelo menos 1% de todas as línguas conhecidas:
De acordo com o Glottolog 5.0 (2024), aqui está uma lista de grandes famílias linguísticas, totalizando 7788 línguas (excluindo línguas de sinais, pidgins e línguas difíceis de classificar):
A contagem de idiomas pode variar significativamente dependendo do uso do idioma.
Em famílias linguísticas, o estabelecimento de relações genéticas depende do processo de mudança linguística. Se duas línguas são membros da mesma família linguística, deve ser porque ambas se originaram da mesma língua ancestral comum. O estabelecimento desse conceito é evidente nos registros históricos de certas línguas, como as línguas românicas, cujos membros são todos derivados do latim. Embora as relações genéticas de algumas línguas não sejam diretamente demonstradas no registro, por exemplo, as línguas românicas e germânicas do norte são relacionadas entre si como subfamílias da família das línguas indo-europeias, não há evidências de proto-indo- Vestígios europeus.
O contato entre línguas pode fazer com que as línguas influenciem umas às outras, seja por meio de empréstimos ou outros meios. Por exemplo, a influência do francês no inglês, a influência do árabe no persa, etc. Essa forma de influência não é equivalente a uma relação genética entre línguas.
Embora o contato linguístico possa levar à influência mútua entre as línguas, isso não constitui um sinal de relacionamento genético.
Diante da diversidade e complexidade da linguagem, a estrutura da família linguística não é absoluta. Especialmente sob a influência de certos fatores especiais, algumas línguas são independentes da classificação de outras línguas, formando o isolamento linguístico. De acordo com o Glottolog, há um total de 423 famílias linguísticas no mundo hoje, das quais 184 são línguas isoladas. O basco, por exemplo, é uma língua isolante.
Ao discutir a evolução e o contato das línguas, deveríamos olhar mais profundamente para as raízes da existência da linguagem?