KazMuzik.net
Music / Technology / Healthcare / Immigration / アメリカ
Google
 
<< "sampo" project at java.netMail-in Rebate Update for Software with two rebates >>

ISO 639 Language Code - KazMuzik Blog
2008-02-22 09:20




sampo project の中に、language に関する package がありますが、これは、言語のコードを扱うためのものです。GNIS(geonames) や Census 2000 は、U.S. 政府によるものですが、言語や国名などのコードは世界で共通に扱われるため、通常は、ISO(International Organization for Standardization, 国際標準化機構)で、決められています。

言語に関しては、ISO 639 で、アルファベット 2文字の ISO 639-1 や、3文字の ISO 639-2 があります。例えば、日本語(Japanese)は、それぞれ、ja, jpn, 英語(English)は、en, eng となっています。なお、ISO 639-2 には、bibliographic code (著書目録など書誌用) の ISO 639-2/B と、terminological code (用語学用)の ISO 639-2/T があり、ほとんどは、同じコードが割り当てられていますが、22 の言語では、例えば、ドイツ語(de) は、2/B の方は、ger, 2/T の方は、deu と、異なるコードになっています。



上記の ISO 639-1 と 639-2 は、どちらもメジャーな言語に対してだけ、定められていますが、その他に、ISO 639-3 というのがあり、これは639-2/T を拡張して、同じくアルファベット3文字で、古代のものやマイナーなものも含めて、可能な限り、すべての自然言語をカバーする目的で、定められました。2007-02-05 に初版が発行されましたが、7589 言語、含まれています。これの、Registration Authority としては、SIL International があり、そこの Downloads のページからは、最新のデータをダウンロードすることができます。sampo の ISO639Language は、2008-02-18 付けのファイルを処理することを考えて、作りました。ちなみに、7701 言語に増えています。

Tags: computer_technology, programming