语种名称代码
我们经常需要用缩写的代码来表示一种语言,比如用en表示英语,用de表示德语。ISO 639就是规定语种代码的国际标准。
最早的时候,ISO 639规定的代码是,用两个拉丁字母表示一种语言,这被称为ISO 639-1。但是,两个拉丁字母最多只有262=676种组合,而世界上已知的语言总数可能有六七千种,因此明显是不够的。所以,后来又规定了ISO 639-2,用三个拉丁字母的组合表示一种语言。
常见语言的ISO 代码如下表。
ISO639-1 Code | ISO639-2 Code | 中文名 | 英文名 |
ar | ara | 阿拉伯语 | Arabic |
ko | kor | 朝鲜语 | Korean |
de | deu | 德语 | German |
ru | rus | 俄语 | Russian |
fr | fra | 法语 | French |
zh | zho | 汉语 | Chinese |
la | lat | 拉丁语 | Latin |
pt | por | 葡萄牙语 | Portuguese |
ja | jpn | 日语 | Japanese |
es | spa | 西班牙语 | Spainese |
en | eng | 英语 | English |
it | ita | 意大利语 | Italian |
hi | hin | 印地语 | Hindi |
yi | yid | 意第绪语 | Yiddish |
完整的语言代码表请看这里。
但是只规定语种代码还不够,在同一种语言中,往往还包括许多种变体,比如中文分为简体中文和繁体中文两种,因此还必须规定子代码。
以往,人们常用zh-CN表示在中国大陆地区使用的中文,也就是简体中文,用zh-TW表示在台湾地区使用的中文,也就是繁体中文。但是,这种表示法很不完善,试问中国大陆地区出版的繁体中文书籍,应该如何用代码表示呢?
目前,语言的标签表示法的国际标准是RFC 4646,名称是《Tags for Identifying Languages》。
简单说,这个文件规定,一种语言的标签应该按照如下方式排列:
下面列出一些与中文有关的语言标签。
此外,还有一些目前仍在使用,但因不符合规范,将被逐步替代(grandfathered)的标签。
有一点需要注意,任何合法的标签都必须经过IANA的认证,已通过认证的标签可以在这个网页查到。此外,网上还有一个非官方的标签搜索引擎。
[延伸阅读]
* W3C: Language tags in HTML and XML
原文链接:https://www.qiquanji.com/post/6583.html
本站声明:网站内容来源于网络,如有侵权,请联系我们,我们将及时处理。
微信扫码关注
更新实时通知