09
2018
12

语种名称代码

们经常需要用缩写的代码来表示一种语言,比如用en表示英语,用de表示德语。ISO 639就是规定语种代码的国际标准。

最早的时候,ISO 639规定的代码是,用两个拉丁字母表示一种语言,这被称为ISO 639-1。但是,两个拉丁字母最多只有262=676种组合,而世界上已知的语言总数可能有六七千种,因此明显是不够的。所以,后来又规定了ISO 639-2,用三个拉丁字母的组合表示一种语言。

常见语言的ISO 代码如下表。

ISO639-1 Code ISO639-2 Code 中文名 英文名
ar ara 阿拉伯语 Arabic
ko kor 朝鲜语 Korean
de deu 德语 German
ru rus 俄语 Russian
fr fra 法语 French
zh zho 汉语 Chinese
la lat 拉丁语 Latin
pt por 葡萄牙语 Portuguese
ja jpn 日语 Japanese
es spa 西班牙语 Spainese
en eng 英语 English
it ita 意大利语 Italian
hi hin 印地语 Hindi
yi yid 意第绪语 Yiddish

完整的语言代码表请看这里。

但是只规定语种代码还不够,在同一种语言中,往往还包括许多种变体,比如中文分为简体中文和繁体中文两种,因此还必须规定子代码。

以往,人们常用zh-CN表示在中国大陆地区使用的中文,也就是简体中文,用zh-TW表示在台湾地区使用的中文,也就是繁体中文。但是,这种表示法很不完善,试问中国大陆地区出版的繁体中文书籍,应该如何用代码表示呢?

目前,语言的标签表示法的国际标准是RFC 4646,名称是《Tags for Identifying Languages》。

简单说,这个文件规定,一种语言的标签应该按照如下方式排列:

下面列出一些与中文有关的语言标签。

此外,还有一些目前仍在使用,但因不符合规范,将被逐步替代(grandfathered)的标签。

有一点需要注意,任何合法的标签都必须经过IANA的认证,已通过认证的标签可以在这个网页查到。此外,网上还有一个非官方的标签搜索引擎。

[延伸阅读]

* W3C: Language tags in HTML and XML

原文链接:https://www.qiquanji.com/post/6583.html

本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时处理。

gzh

微信扫码关注

更新实时通知

« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。