快速回答
语系是指共享同一祖语的语言群, 例如西班牙语、法语和意大利语都源自拉丁语。语言学家通过系统性的语音对应与语法规律来判定语系, 而不是看是否使用同一种字母表或是否有大量借词。按母语者人数计算, 最大的语系包括印欧语系、汉藏语系、尼日尔-刚果语系、亚非语系和南岛语系。
语言家族是语言学家用来把拥有共同祖先的语言归为一组的方法。也就是说,这些语言随着时间从同一种更早的语言发展而来,比如西班牙语、法语和意大利语都源自拉丁语。语言家族的重点不是“这些语言看起来很像”,而是“这些语言在语音、语法和核心词汇上呈现出系统性的继承规律”。
理解语言家族会让语言学习更可预测。如果你会一门罗曼语族语言,你常常能在另一门罗曼语族语言里猜到词汇和句子结构。它也能帮你避免错误推断,比如因为日语使用汉字就以为日语“基本就是中文”,或者因为英语有很多拉丁语和法语借词就以为英语“以拉丁语为基础”。
如果你通过真实语料学习英语,把这篇概览和用于英语听力的电影和电视剧搭配起来,会更容易注意到英语里哪些部分是日耳曼语系的(核心动词、日常词),哪些部分更偏罗曼语族(正式词汇、学术术语)。
什么算语言家族(什么不算)
语言家族是一种谱系分类。语言之所以相关,是因为它们都源自某个原始语言。语言学家用比较法,通过对比现代形式和历史形式,来重建这个原始语言的部分特征。
借词不会形成语言家族。英语从法语和拉丁语借了成千上万的词,但英语仍然是日耳曼语系,因为它的核心语法和基础词汇模式可以追溯到原始日耳曼语。
书写系统也不能定义语言家族。越南语今天使用拉丁字母,但它属于南亚语系,而不是罗曼语族。印地语和乌尔都语可以用不同文字书写,但它们在印度-雅利安语支内部关系非常近。
语言学家如何检验亲缘关系
关键思路是大量词汇之间存在规则性的语音对应。如果语言A里的某个音,在相同环境下总是与语言B里的某个音对应,并且这种对应出现在大量基础词汇中,这就是继承关系的证据。
历史语言学家Lyle Campbell在其历史语言学研究中强调,长得像的词不够。规律必须是系统性的,而且要出现在通常不容易借用的词汇里,比如亲属称谓、身体部位和基础动词。
全局视角:世界上有多少语言和多少家族?
Ethnologue第27版(2024)报告称,全球现存语言大约有7,000多种,具体取决于你如何区分语言与方言。由马克斯普朗克研究所维护的Glottolog对语言及更高层级的分组进行编目,常用于更保守、更强调证据的分类。
语言家族的数量取决于你的分类标准。有些分组被广泛接受(印欧语系、南岛语系)。另一些则存在争议,会因证据和方法不同而被拆分或合并。
💡 一个实用的理解方式
如果你想要一张对学习者友好的地图,可以先关注少数几个大型语系,再加上一小份重要的孤立语言清单。这样你就能把握大部分文化和语言版图,而不必把它变成博士课题。
印欧语系:随着帝国、贸易和迁徙扩散的语系
按母语者数量来看,印欧语系常被视为最大的语系。这主要因为它包含印度-雅利安语支(印地语及相关语言)以及许多主要的欧洲语言。
你确实常听到的主要语支
罗曼语族:西班牙语、法语、意大利语、葡萄牙语、罗马尼亚语。它们源自拉丁语,共享语法性别等特征,也有大量同源词。
日耳曼语族:英语、德语、荷兰语、瑞典语、丹麦语、挪威语、冰岛语。英语的骨架是日耳曼语族的,核心动词(be, have, go)、代词和许多日常词都属于这一层。
斯拉夫语族:俄语、波兰语、捷克语、乌克兰语、塞尔维亚语/克罗地亚语/波斯尼亚语。斯拉夫语言常有丰富的格系统,以及强调体的动词系统。
印度-雅利安语支:印地语、孟加拉语、旁遮普语、马拉地语、古吉拉特语、乌尔都语(在结构层面与印地语关系很近)。这一语支占了印欧语系使用者的很大比例。
一个文化视角:为什么英语让人感觉有“两层”
英语有日耳曼语系的核心,也有罗曼语族的“语域层”。日常口语里你会说help、start、buy、ask。正式语境里你会用assist、commence、purchase、inquire。
这也是很多英语学习者觉得“简单英语”和“学术英语”几乎像两种语言的原因之一。语系背景能解释这一点:语法保持日耳曼语系,而词汇通过接触大规模扩张。
如果你想用一个有趣的方式观察现代英语如何切换语域,可以把日常对话和我们英语俚语指南里俚语密集的片段对比一下。你会看到随意口语有多大程度会回到日耳曼语系的核心层。
汉藏语系:庞大但书写传统差异很大的语系
汉藏语系包括汉语族语言(常被归在“中文”之下,比如普通话和粤语)以及许多藏缅语族语言。
一个常见误解是“中文是一种语言”。现实是,许多汉语族变体彼此并不能互通,即使它们共享汉字书写系统。
为什么“汉字”不等于“汉语”
书写系统可以统一文化,但不一定统一口语。历史上,文言或书面汉语曾作为一种有声望的书面标准,覆盖不同地区的口语变体。
这对学习者很重要,因为它把两种技能分开了:识字阅读和听懂口语。你可以认得一个字,但仍然听不懂一段很快的对话。
尼日尔-刚果语系:按语言数量计非洲最大的语系
尼日尔-刚果语系按独立语言数量计是世界最大的语系之一,覆盖撒哈拉以南非洲的大部分地区。它包括斯瓦希里语(常被归入班图语支这一重要分支)和约鲁巴语等许多语言。
尼日尔-刚果语系中许多语言最知名的特征之一是名词类别系统,它可能比罗曼语族里熟悉的性别系统更复杂。
一个文化视角:语言多样性与身份认同
在许多非洲国家,多语并不是例外,而是常态。人们可能在家里用一种语言,在市场用另一种语言,在学校用国家语言或官方语言。
这种日常的多语现实也是为什么用“国家数量”来衡量一种语言的影响力会误导。某种语言可以跨越国界深度参与日常生活,即使它在任何地方都不是唯一的国家语言。
亚非语系:闪米特语族及其之外
亚非语系包括阿拉伯语和希伯来语等闪米特语族语言,也包括柏柏尔语支、库施特语支等其他分支。
阿拉伯语在文化上是个特殊案例,因为现代标准阿拉伯语(正式的书面与播音标准)与各地口语变体之间关系紧密,但不同地区的口语差异也可能很大。
现实中的双言现象
语言学家Charles A. Ferguson与“双言现象”概念密切相关,也就是一种“高位”变体用于正式写作,另一种“低位”变体用于日常口语。阿拉伯语是这一传统讨论中的经典例子之一。
对学习者来说,这意味着你要明确目标:读新闻、进行对话,还是两者都要。仅靠语系标签并不能告诉你正式语和口语之间的差距有多大。
南岛语系:横跨海洋的语系
南岛语系从马达加斯加一路延伸,跨越海洋东南亚进入太平洋。它包括马来语/印尼语、他加禄语(菲律宾语)、爪哇语以及许多大洋洲语言。
南岛语系的地理扩张是最清晰的例子之一,说明航海、迁徙和贸易如何塑造语言史。它也提醒我们,按“大洲”来推断语言家族往往会失效。
达罗毗荼语系:南亚的重要语系
达罗毗荼语系语言包括泰米尔语、泰卢固语、卡纳达语和马拉雅拉姆语,主要分布在印度南部和斯里兰卡部分地区。它们不是印欧语系,尽管它们与同一国家里的印度-雅利安语支语言并存。
这很好地说明了为什么“国家语言”的叙事会掩盖深层的语言多样性。一个国家内部可以同时包含多个语系,它们各自拥有漫长且独立的历史。
突厥语系:由结构与历史连接起来的语系
突厥语系包括土耳其语、阿塞拜疆语、哈萨克语、乌兹别克语、吉尔吉斯语等。许多突厥语言共享一些学习者很快就能注意到的特征,比如元音和谐与黏着式构词(通过叠加后缀表达语法)。
突厥语系也说明语言家族可以跨越现代政治边界。语系地图不会与今天的国界重合,因为它反映的是更早的迁徙与接触区域。
乌拉尔语系:芬兰语、匈牙利语,以及欧洲里“不是印欧语系”的意外
乌拉尔语系包括芬兰语、爱沙尼亚语和匈牙利语,也包括俄罗斯及周边地区的若干小语种。
很多人因为地理位置以为匈牙利语是斯拉夫语族。其实不是。匈牙利语属于乌拉尔语系,它的结构可能与周边的印欧语系语言差异很大。
一个文化视角:“欧洲”不等于“印欧”
人们常把欧洲讲得好像语言上很统一,但事实并非如此。乌拉尔语系语言、巴斯克语(孤立语言)以及高加索地区的语言都表明,欧洲的语言史有更深的层次,早于现代民族国家。
日本语系、朝鲜语系,以及“语系”确定性的边界
日语(日本语系)和韩语(朝鲜语系)通常被视为两个独立语系,而不是已被证明属于某个更大的共同语系。有人提出把它们与其他群体联系起来,但强共识有限。
日语
日语历史上大量借入汉语,包括很大一部分汉语词汇层(Sino-Japanese vocabulary)以及汉字的使用。这种借用会造成表面相似,但不能证明谱系亲缘关系。
如果你在学日语发音,要记住它是以拍为节奏单位的。比如,星座 (seiza) 的读法是 SAY-za,sei占两拍再加za,不是“SEH-zah”。
韩语
韩语历史上也借入过词汇(包括来自汉语的借词),但它的语法和音系很独特。和日语一样,出于分类目的,它常被视为自成一系。
如果你想从书写系统角度理解,可以看看不同文字如何影响人们对“亲缘关系”的感知:日语使用汉字、平假名和片假名,而韩语使用Hangul。文字会让语言看起来比实际更接近或更疏远。
孤立语言:只有一个成员的“家族”
孤立语言指没有被证明存在亲属语言的语言。欧洲最著名的例子是巴斯克语。
孤立语言很重要,因为它提醒我们语言史包含灭绝与断层。一种语言可能是曾经更大语系的最后幸存者,也可能因为年代久远且变化巨大,以现有证据很难证明其亲缘关系。
⚠️ 谨慎对待刷屏的'万物皆亲缘'图表
一些网络谱系树把带有猜测性的超语系当作定论来画。用于学习和常识时,建议只采用广泛接受的语系,把更深层的联系当作假说,除非像Glottolog这样的来源支持它们。
语言家族如何影响语言学习(实用要点)
同源词有帮助,但有边界
如果你会西班牙语,你会认出很多法语和意大利语词。这就是语系带来的优势。
但同源词也会误导你。假朋友词会出现,因为词义会漂移。语系关系提高相似的概率,但不保证意义完全一致。
语法的“感觉”常随语系传播
语序倾向、动词如何标记时态或体、名词如何标记语法角色(格、介词)常常在同一语系里聚集。这也是为什么学习者有时会说某种语言“思维方式不同”。
WALS(World Atlas of Language Structures)在这里很有用,因为它把谱系继承与类型特征区分开来。两种无亲缘关系的语言也可能因为接触,或因为这是常见的结构解决方案,而共享某个特征。
语系不是命运:接触区会重塑语言
英语是日耳曼语系,但词汇上深受罗曼语族影响。斯瓦希里语是班图语支,但有大量阿拉伯语借词。日语是日本语系,但深受汉语影响。
这也是为什么通过真实媒体学习很重要。在真实对话里,你能听到接触层:借词、语码转换和语域切换。这也是为什么用电影练习能加速听力,尤其对高频口语模式很有效。
一张对学习者友好的世界语系“迷你地图”
如果你想记一套可控的清单,可以从这些开始:
- 印欧语系(日耳曼语族、罗曼语族、斯拉夫语族、印度-雅利安语支)
- 汉藏语系
- 尼日尔-刚果语系
- 亚非语系
- 南岛语系
- 达罗毗荼语系
- 突厥语系
- 乌拉尔语系
- 一小份孤立语言清单(巴斯克语是经典例子)
之后你可以按需要补充区域性语系,尤其是在美洲、新几内亚和澳大利亚,那里的多样性很高,许多语系规模也更小。
语言濒危,以及为什么语系会“变小”
UNESCO的Atlas of the World’s Languages in Danger指出,许多小语种面临严重风险。当一种语言消失,我们会失去独特的文化知识,也会失去可能澄清语系关系的证据。
这不仅是文化问题,也是分类问题。现存语言更少、记录更少,会让我们更难检验关于深层亲缘关系的假说。
常见误解(以及快速纠正)
“如果两种语言共享很多词,它们一定有亲缘关系”
不一定。借词可能非常大量,尤其在宗教、科学和技术领域。英语和日语共享许多来自全球英语的现代借词,但它们并没有亲缘关系。
“如果两种语言使用同一种字母表,它们一定有亲缘关系”
不是。拉丁字母被许多语系的语言使用。文字是一种工具,不是语系标记。
“方言只是口音”
有些“方言”彼此无法互通,是否算作不同语言取决于社会与政治语境。边界并不纯粹由语言学决定。
语言学家John McWhorter在其面向大众的语言变化与多样性写作中,经常强调社会历史如何影响我们把什么称为语言、把什么称为方言。谱系树是语言学的,但标签也带有政治性。
用语言家族更高效地学英语
英语学习者从语系意识中能获得额外收益,因为英语是一种高度接触型语言。你可以通过观察哪些词更可能来自罗曼语族(通常更长、更正式),哪些更可能来自日耳曼语族(更短、更常用、更口语),来更快扩充词汇。
比如,在日常场景里你经常听到日耳曼语系的词,包括情绪反应和辱骂。如果你好奇真实用法里会怎样呈现,可以把随意对话和英语脏话里更强烈的语域做对比。这种反差是一堂真实的语域课,而不只是词表。
另外,如果你在打牢英语核心基础,把这篇文章和像英语数字这样的结构化清单搭配起来会更有效,因为高频基础词最能清楚体现语系模式。
用电影和电视剧学习语系的一个简单方法
选一个片段,做两遍:
- 第一遍:关注意思和节奏。
- 第二遍:注意词源和语域。说话者是在选短的日常词,还是更长的正式词?
这在英语里特别有效,因为同一个意思可以用不同层表达:help vs assist,ask vs inquire,start vs commence。时间久了,你会逐渐形成直觉,知道哪一层更适合这个场景。
如果你想要一个整理好的起点,可以用我们的英语电影清单,挑选日常对话清晰的片段。
💡 一句话要点
语言家族解释了为什么有些语言让人觉得熟悉,但真实听力会让你看到历史如何活在现代口语里。
想继续在真实语境中理解英语,可以浏览完整的Wordy博客,优先看那些最贴近你在喜欢的剧里经常听到的主题。
常见问题
用最简单的话说, 什么是语系?
世界上最大的语系是哪一个?
中文和日语属于同一个语系吗?
语言学家如何证明两种语言有亲缘关系?
为什么有些语言找不到已知的亲属语言?
来源与参考资料
- Ethnologue, 第27版, 2024
- Glottolog (Max Planck Institute for Evolutionary Anthropology), 访问于2026
- Encyclopaedia Britannica, 'Language family', 访问于2026
- UNESCO Atlas of the World's Languages in Danger, 访问于2026
- World Atlas of Language Structures (WALS Online), 访问于2026

