ISO 639-3
ISO 639-3:2007 Codes for the representation of names of languages — Part 3:Alpha-3 code for comprehensive coverage of languages は、国際規格 ISO 639 言語コードのひとつであり、国際標準化機構によって2007年2月5日に公刊された[1]。
ISO 639-3 は ISO 639-2 3文字コードの拡張で、知られるすべての自然言語をカバーすることを目的とする。拡張された言語の範囲は主に ISO 639-3 の登録主体になっている[2]国際SILの出版物であるエスノローグの言語コードを元にしている。ISO 639-3 は、その言語が現存の言語であるか消滅言語・古代語・人工言語であるかを問わず、使用者の数を問わず、書かれた記録があるかどうかを問わず、可能なかぎり完全な言語の一覧を提供する[1]。ただし、インド・ヨーロッパ祖語のような再建された言語は含まない[3]。
ISO 639-3 はさまざまな応用に供することを目的とする。計算機と情報システムでは、インターネットのように多言語を支援する必要があるため、広く使われる。また、言語学の文献その他において、言語名では不明瞭であったり多義的であったりする場合に、それを補うために使われる。
ISO 639-3 は言語を包括的にカバーし、すべての言語に等しい機会を与え、情報技術で広く採用されているため、情報格差の問題に対応するための重要な技術を提供する。
Contents
言語コード
ISO 639-3 は、ISO 639-1 で定義されている(世界の文献でもっとも頻繁に使われる )すべての言語を含んでいる。ISO 639-2 は言語だけでなく複数の言語グループにもコードを与えているが、ISO 639-3 はそうではないため、ISO 639-3 は ISO 639-2 の上位集合ではない。また、ISO 639-2 にはBコードとTコードの2種類があるが、ISO 639-3 はTコードを使用している。
例:
言語 | 639-1 | 639-2 (B/T) | 639-3 型 |
639-3 コード |
---|---|---|---|---|
英語 | en |
eng |
individual | eng
|
ドイツ語 | de |
ger 、deu |
individual | deu
|
アラビア語 | ar |
ara |
macro | ara
|
individual | arb 、その他
| |||
中国語 | zh |
chi 、zho [4]テンプレート:,[5] |
macro | zho
|
北方語 | individual | cmn
| ||
広東語 | individual | yue
| ||
閩南語 | individual | nan
|
2012年4月の段階で、ISO 639-3 には 7,776 の言語を含んでいる[6]。
ISO 639-3 に含まれる言語には以下のものを含む:639-2 の単独の言語、エスノローグに記述された現代語、Linguist Listに記述された歴史的な変種・古代語・人工言語[7]、および毎年のコメント期間中に推奨された言語。
機械可読なデータファイルが登録主体によって提供されている[6]。このデータファイルを使用して ISO 639-1 または ISO 639-2 から ISO 639-3 への変換を行うことができる。
ISO 639-3 は原則として、主観的でない基準に従って言語の区別を行う[8]。方言その他の言語未満の変種について識別子を与えることを目的としない[9]。しかし言語の区別には主観がはいりこみ得る。とくに文字で書かれたり教育やメディアで使用されたりすることによる様式化が進んでいない口頭言語の変種の場合は特にその傾向が高い。
コード空間
ISO 639-3 のコードはアルファベット3文字であるため、格納できる言語の最大値は 26 × 26 × 26=17576 である。ISO 639-2 は4つの特殊コード・520の予備コード・23のBのみのコードを含んでいるため、ISO 639-3 では 547 のコードを使用することができない。したがって、17576 - 547=17030 が最大値となる。
ISO 639-2 の言語グループ名のうち ISO 639-5 に定義されていないものを除くと、さらにその数は少なくなる。
マクロランゲージ
ISO 639-2 のうち56の言語は、ISO 639-3 では標準の目的において「マクロランゲージ」と考えられている[10]。
これらのマクロランゲージのうち、いくつかは ISO 639-2 のうちに個別言語を全く含んでおらず(例:ara
アラビア語)、ISO 639-3 で新たに定義された。他のマクロランゲージである nor
(ノルウェー語)については、ISO 639-2 のうちにすでに2つの個別言語を含んでいる(nno
ニーノシュク および nob
ブークモール)。
このことは、ISO 639-2 である言語(例:ara
、アラビア語)の方言と見なされていた言語(例:arb
、標準アラビア語)が、ISO 639-3 では個別言語と見なされることがあることを意味する。
マクロランゲージは、言語学的には異なる言語であるが、話者にとっては同じ言語の2つの変種として扱われる場合(例:ダイグロシアの場合)を扱うための試みである。
例:
- http://www.sil.org/iso639-3/documentation.asp?id=ara (アラビア語全般、639-2)
- http://www.sil.org/iso639-3/documentation.asp?id=arb (標準アラビア語、639-3)
完全なマクロ言語の一覧は以下を参照:“Macrolanguage Mappings”. sil.org. . 2012閲覧.
集合的言語
集合的言語コード要素とは、いかなる文脈においても単一の言語と考えられない、個別言語のグループを表す識別子である[11] 。これらのコードは個別言語でもマクロランゲージでもない。
ISO 639-2 には集合的言語のための3文字識別子が含まれるが、ISO 639-3 からは除外されている。したがって、ISO 639-3 は ISO 639-2 の上位集合ではない。
ISO 639-5 は語族や語派のための集合的コードを定義している。
汎用コード
特定のコードのいずれも妥当でない場合のために、4つのコードが定義されている。これらのコードは、主にデータベースのように、ISO コードが存在しなくても指定しなければならない場合に使用することを目的とする。
コード | 意味 |
---|---|
mis |
その他の言語 |
mul |
複数言語 |
und |
不明言語 |
zxx |
言語ではない |
mis
[12]は、ISO標準に(まだ)含まれていない言語のために用いる。
mul
は、データが複数の言語からなるが、データベースが単一のISOコードを指定することを要求しているときに用いる。
und
は、データに使用されている言語名が不明である(誤ってラベルづけされている、ラベルづけされていないなど)場合に用いる。トロイ語のように、言語名は存在するが言語そのものが不明である場合に使用することは目的としていない。
zxx
は、データが言語でない場合(動物の鳴き声など)に用いる[13]。
以上に加えて、qaa
から qtz
までの範囲はローカルに使用する場合のために予約されている。たとえばLinguist List で消滅した言語のために用いる。Linguist List ではこのうちひとつに汎用の値を割りあてている。
コード | 意味 |
---|---|
qnp |
名前のない祖語 |
このコードは、言語系統図において名前のない節点を表すのに使われる。
保守のプロセス
ISO 639-3 のコード表は変更可能であるが、すでに使われているコードを守るため、変更が許されるのは以下の場合に限られる:[14]
- ある項目に対する参照情報の変更(言語名・型や範囲の分類を含む)
- 項目の追加
- 重複または誤った項目を非推奨にすること
- ある項目を別の項目に併合すること
- 既存の項目を複数の新しい項目に分割すること
変更は年1回行われる。各変更要求は最低3か月の公開レビュー期間が与えられる。
ISO 639-3 のサイトの「命名の範囲」[15] およびSILの言語の型[16]において、コードを与える範囲と、どのような条件を満たさなければならないかを説明している。たとえば、人工言語に識別子を与えることはできるが、それが人間のコミュニケーションのために設計されており、かつ文献がある場合に限られる。この制約は個々人の発明に対する要求がなされることを防ぐためにある。
登録主体のWebサイトでは、ISO 639-3 のコード表がどのように保守されるかついて説明している[17]。同時に、変更要求を受けとり処理するためのプロセスも記述している[18]。
このWebサイトでは変更要求の書式と、追加提案に関する情報を収集するための第二の書式が提供されている。任意の団体が変更要求を提出できる。提出された要求はまず登録主体によって不備がないかレビューされる。
不備のない文書による要求を受けとった場合、その要求が公開されている「変更要求インデックス[19]」に加えられる。同時に「Lingust List」の「LINGUIST」ディスカッション・リストおよび関連すると登録主体がみなしている他のリストに告知がなされ、変更要求に対する公開レビューに招待する。どのリストのオーナーおよび個人も特定の地域や語族に関する変更要求に関する通知を受け取ることができる。受け取ったコメントは他の団体がレビューするために公開される。コメントの総意にもとづいて、変更要求は撤回されるか、または「候補状態[20]」に昇格する。
毎年のレビュー期間が終了する3か月前に、LINGUIST のディスカッション・リストおよび他のリストに、「候補状態の変更要求[21]」に関する告知がなされる。すべての要求は、レビュー期間が終了するまでレビュー・コメントが可能である。
毎年のレビュー期間の終了時に決定がなされる。要求は全体あるいは一部が採用されるか、修正されて翌年に持ちこされるか、または検討が撤回される。各変更要求と、それに対する決定・決定の根拠の公開アーカイブが保守されている[22]。
批判
言語学者のモーリー、ポストおよびフリードマンは ISO 639-3 に対してさまざまな批判を提起している[23]。
- 3文字コード自身に問題がある。これらのコードは公式には恣意的で技術的なラベルとされているが、実際にはしばしば言語名の省略からなっており、そのうちいくつかは差別的である。たとえば、イェム語には
jnj
が割りあてられているが、これは差別語の「Janejero」に由来する。これらのコードはその言語の話者を侮辱するものであるが、標準において割り当てを変更することができない。 - 標準の管理に問題がある。SIL はキリスト教の宣教団体であり、透明性や説明責任において不適当である。何が言語としてコード化するに値するかの決定が内部で行われる。外部の提案は歓迎されたりされなかったりするが、決定自身は不透明であり、多くの言語学者が標準を改訂することを諦めている。
- 言語に恒久的な識別子を与えることは、言語の変化と両立しない。
- 言語と方言はしばしば厳格に区別できない。方言連続体はさまざまな区分が可能である。そのような区分はしばしば社会的・政治的要因によってなされる。
- ISO 639-3 は人々の所属に関する決定を行う権力者によって誤解ないし誤用され、言語の話者が自分の所属を決めたり自分の言語が何であるかを決めたりする権利を奪いかねない。SIL はこのような問題に対して注意を払ってはいるものの、確立した標準には本質的にこの問題をかかえており、ISO や SIL の意図しない方向に使われる(または誤用される)可能性がある。
マルティン・ハスペルマート はこの指摘のうちの4つを認めたが、言語変化については認めなかった[24]。ハスペルマートによれば、どのような言語の記述もそれが何の言語であるかを同定することが必要であるし、言語の異なる段階を区別するのは容易であるから、言語変化に関する指摘は不当なものである。ハスペルマートは、言語学者は languoid レベルのコード化を行うことを好むだろうとする。「言語学者にとって、それが言語であるか、方言であるか、緊密な関係にある複数の言語であるかが意味を持つことはほとんどない」ためである。ハスペルマートはまた、ISO が言語の同定を行うことが妥当かにも疑問を投げかける。ISO は工業規格の機関であるが、言語の文献と用語は科学的な努力であるとする。ハスペルマートは言語コードの本来の必要性は「翻訳とローカライズの経済的重要性」にあり、ISO 639-1 と ISO 639-2 はそのために作られたことを指摘する。しかし ISO 639-3 によって提供されるような「狭いコミュニティーで使われ、全くないしほとんど書かれることのない、しばしば絶滅の危機にある、ほとんど知られていない言語」を含む包括的なコードが工業的に必要かどうかは疑問とする。
日本の諸言語と ISO 639-3
ISO 639-3 | 言語 |
---|---|
ain |
アイヌ語 |
jpn |
日本語 |
ryn |
北奄美大島語 |
ams |
南奄美大島語 |
kzg |
喜界語 |
tkn |
徳之島語 |
okn |
沖永良部語 |
yox |
与論語 |
xug |
国頭語 |
ryu |
沖縄語 |
mvi |
宮古語 |
rys |
八重山語 |
yoi |
与那国語 |
jsl |
日本手話 |
以上のうち日本語は ISO 639-1 と ISO 639-2 の両方で、アイヌ語は ISO 639-2 でコード化されている。
使用例
- エスノローグ
- Linguist List
- OLAC
- IETF言語タグ
- Lexical Markup Framework(機械可読辞書を表現するための国際標準)
- 言語別 TLD (lcTLD) として提案[25][26]
- Unicode の CLDR (ISO 639-2 に含まれない数百の言語について ISO 639-3 を使用)
- Microsoft Windows 8[27] (公開時の ISO 639-3 のすべてのコードをサポート)
脚注
- ↑ 1.0 1.1 “ISO 639-3 status and abstract”. iso.org (2010年7月20日). . 2012閲覧.
- ↑ “Maintenance agencies and registration authorities”. ISO. . 2012閲覧.
- ↑ “Types of individual languages - Ancient languages”. sil.org. . 2012閲覧.
- ↑ Ethnologue report for ISO 639 code:zho on ethnologue.com
- ↑ ISO639-3 on SIL.org
- ↑ 6.0 6.1 “ISO 639-3 Code Set”. Sil.org (2007年10月18日). . 2012閲覧.
- ↑ “ISO 639-3”. sil.org. . 2012閲覧.
- ↑ “Scope of Denotation:Individual Languages”. sil.org. . 2012閲覧.
- ↑ “Scope of Denotation:Dialects”. sil.org. . 2012閲覧.
- ↑ “Scope of denotation:Macrolanguages”. sil.org. . 2012閲覧.
- ↑ “Scope of denotation:Collective languages”. sil.org. . 2012閲覧.
- ↑ 「 miscellaneous」に由来。
- ↑ Field Recordings of Vervet Monkey Calls. Entry in the catalog of the Linguistic Data Consortium. Retrieved 2012-09-04.
- ↑ “Submitting ISO 639-3 Change Requests:Types of Changes”. sil.org. . 2012閲覧.
- ↑ “Scope of Denotation for Language Identifiers”. sil.org. . 2012閲覧.
- ↑ “Types of Languages”. sil.org. . 2012閲覧.
- ↑ “ISO 639-3 Change Management”. sil.org. . 2012閲覧.
- ↑ “Submitting ISO 639-3 Change Requests”. sil.org. . 2012閲覧.
- ↑ 英: change request index
- ↑ 英: candidate status
- ↑ 英: candidate status change requests
- ↑ “ISO 639-3 Change Request Index”. sil.org. . 2012閲覧.
- ↑ Morey, Stephen; Post, Mark W.; Friedman, Victor A. (2013). “The language codes of ISO 639:A premature, ultimately unobtainable, and possibly damaging standardization”. PARADISEC RRR Conference
- ↑ Martin Haspelmath, "Can language identity be standardized? On Morey et al.'s critique of ISO 639-3", Diversity Linguistics Comment, 2013/12/04
- ↑ “Languages in the Root:A TLD Launch Strategy Based on ISO 639”. Circleid.com (2004年10月5日). . 2012閲覧.
- ↑ “ICANN Email Archives:[gtld-strategy-draft]”. Forum.icann.org. . 2012閲覧.
- ↑ “Over 7,000 languages, just 1 Windows”. Microsoft (2014年2月5日). . 2014閲覧.
関連文献
- Aristar, Anthony (2006). “ISO standardized language codes and the Ethnologue”. SSILA Bulletin 247 .
- Dobrin, Lise M.; Good, Jeff (2009). “Practical language development:Whose mission?”. Language 85 (3): 619–629. doi:10.1353/lan.0.0152 .
- Epps, Patience, et al (2006). “In opposition to adopting Ethnologue's language codes for ISO 639-3”. SSILA Bulletin 246 .
- Golla, Victor, ed (2006). “SSILA statement on ISO 639-3 language codes”. SSILA Bulletin 249 .