ISO 639
ISO 639 är en internationell standard för språkkoder utgiven av Internationella standardiseringsorganisationen, som anger 2–3 bokstäver långa koder för namnen på världens språk. Genom att ersätta språkens namn är koderna användbara i många sammanhang. De används för att på ett otvetydigt och språkoberoende sätt kunna hänvisa till olika språk i biblioteksregister, webbsidor, och i många sammanhang där det förekommer informationshantering på olika språk, inklusive för datoriserade system.[1]
Språkkoder skall inte förväxlas med landskoder i ISO 3166, eller toppdomän i domännamn på Internet, som syftar till att identifiera enskilda länder. Till exempel är landskoden för Sverige enligt ISO 3166 ”SE”, medan språkkoden för svenska språket enligt ISO 639-1 är ”sv”. Wikipedias olika språkversioner har webbadresser vars första del i stort sett följer ISO 639-1.
Standarden
redigeraStandarden ges ut i fem[1] delar, som revideras individuellt. Det är också olika organisationer som är registeransvariga för de olika delarna, och som har ansvaret för granskning och uppdatering.[2] De har dock gemensamt att de alla har namn på två av ISO:s tre officiella språk[3] som följer samma mönster:
- På engelska: ISO 639-n:yyyy Codes for the representation of names of languages — Part n: ...
- På franska: ISO 639-n:yyyy Codes pour la représentation des noms de langue — Partie n: ...
Standard | Deltitel på engelska och franska (kursivt) |
Beskrivning | Ansvarigt institut | Senaste utgåva |
Senast granskad |
---|---|---|---|---|---|
ISO 639-1:2002 | Part 1: Alpha-2 code[4] Partie 1: Code alpha-2[5] |
Koder med två bokstäver – Ursprungligen framtagna med hänsyn till terminologi, lexikografi och lingvistik, men är idag flitigt använda även i andra sammanhang.[4] | Austrian Standards International[2][6] | 2002-07[4] | 2019[4] |
ISO 639-2:1998 | Part 2: Alpha-3 code[7] Partie 2: Code alpha-3[8] |
Koder med tre bokstäver för språken i del 1 samt ytterligare många språk.[9] Den innehåller dessutom en del språkgrupper och språkfamiljer.[10] Vissa språk i standarden har två koder – en för bibliografiskt syfte och en för terminologi.[9] | Library of Congress[2] | 1998-11[7] | 2021[7] |
ISO 639-3:2007 | Part 3: Alpha-3 code for comprehensive coverage of languages[11] Partie 3: Code alpha-3 pour un traitement exhaustif des langues[12] |
Koder med tre bokstäver för i princip alla språk som talas eller har talats, oavsett om de saknar skriftspråk. Skall i princip täcka alla kända språk, oavsett hur stora de är, eller om de talas eller är utdöda.[11][13] | SIL International[2] | 2007-02[11] | 2021[11] |
ISO 639-4:2010 | Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines[14] Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre[15] |
Riktlinjer och allmänna principer för språkkodning.[14] | ISO/TC 37/SC 2 (ISO)[14] |
2010-07[14] | 2016[14] |
ISO 639-5:2008 | Part 5: Alpha-3 code for language families and groups[16] Partie 5: Code alpha-3 pour les familles de langues et groupes de langues[17] |
Koder med tre bokstäver för levande och utdöda språkfamiljer och geografiskt grupperade språkgrupper.[16][13] | Library of Congress[10] | 2008-05[16] | 2022[16] |
Under perioden 2009–2014 fanns det även en sjätte del av standarden, med fyrställiga bokstavskoder, men denna del befanns inte fylla någon funktion. Den var dessutom svår att utveckla och underhålla, så den drogs tillbaka.[18]
Om språkfamiljer och språkgrupper
redigeraSpråkfamiljer och språkgrupper finns delvis med redan i del 2. Den listan är dock begränsad, och är bara med i syfte att kunna ange språk som inte har någon egen kod.[19] I del 5 finns betydligt fler språkfamiljer och -grupper med, och syftet är att vara, eller bli, heltäckande för levande och döda språkgrupper och -familjer.[16] Den ansvariga institutionen, Library of Congress, tar därför emot ansökningar om revideringar eller tillägg, och uppdaterar standarden efter hand.[19]
Notera dock att syftet med standarden är att ange koder för språkens, språkvarieteternas och språkfamiljernas namn, inte att klassificera språken vetenskapligt. Även om del 5 innehåller ett förslag på hierarki inom språkfamiljerna, så är detta förslag endast en antydan, inte en fastslagen del av standarden. Det finns inte heller någon koppling av enstaka språk till någon av familjerna i standarden.[19] Syftet är snarare att vara ett hjälpmedel för forskningssamhället, och för registrering av språk.[20]
Makrospråk
redigeraI ISO 639-3 definieras många koder för språk som i ISO 639-1 och ISO 639-2 är samlade under en gemensam kod. Delstandarden definierar därför begreppet makrospråk för ett språk vars varieteter i olika kontexter antingen kan ses som egna språk, eller som en varietet av ett makrospråk.[21] Till exempel är det i vissa sammanhang praktiskt att hantera alla varieteter av arabiska som ett språk (ISO 639-1: ar). I andra sammanhang är det viktigt att skilja på tourkou och hassaniyya, eller tunisisk arabiska och irakisk arabiska.
Redan i ISO 639-1 och ISO 639-2 förekommer vissa makrospråk.[22] Till exempel förekommer för norska följande beteckningar:[23]
Makrospråk | Språkvarietet | ||||
---|---|---|---|---|---|
Språk | ISO 639-1 | ISO 639-2 | Språk | ISO 639-1 | ISO 639-2 |
Norska | no | nor | Nynorska | nn | nno |
Bokmål | nb | nob |
Specialkoder och reserverade kodpunkter
redigeraISO 639-2 och ISO 639-3 innehåller fyra stycken koder med speciell funktion: mis – Övrigt språk (kod saknas); mul – Flerspråkigt; und – Odefinierat språk; och zxx – Icke-språkligt.[24] Koderna används bland annat i bibliotekskataloger för att klassificera medium som saknar språkligt innehåll, flerspråkiga verk, och verk på språk som det inte har definierats någon kod för.[25] ISO 639-1 saknar motsvarande koder.[24]
Del 2 och 3 har också reserverat ett antal koder för lokalt bruk. De 520 koderna qaa–qtz är garanterade att aldrig definieras, så att de kan utnyttjas på ett sätt som användare behöver. De skall dock aldrig finnas med vid delning av data till andra användare, då detta motverkar syftet med dem. Del 1 har inga reserverade koder på samma sätt, men qa–qt är idag ounyttjade.[24]
Hierarkier
redigeraDel 5, standarden för språkfamiljer och språkgrupper, definierar också ett sätt att ange att ett språk eller en familj eller grupp tillhör en viss angiven familj eller grupp. Denna hierarkiska ordning för släktskaper eller grupptillhörigheter anges i standarden med den större gruppen före det språk eller den familj som tillhör gruppen. Nivåerna avskiljs med kolon.[26]
Till exempel:
- Sydsamiska är ett samiskt språk, en grupp av finsk-ugriska språk inom den uraliska språkfamiljen.
Anges som:
Hierarkin i sig anger inte nödvändigtvis släktskap, så "cau : ccs : kat" behöver inte betyda att författaren avser att georgiska tillhör familjen kaukasiska språk, bara att kartvelska språk tillhör den gruppen, till exempel genom geografisk närhet eller språkförbund.
Användning
redigeraStandarden används inom många områden där registrering av språk förekommer. I Sverige används den bland annat av bibliotekskatalogen Libris (ISO 639-2[a]).[25] och SCB (ISO 639-3) för statistik om undervisning i språk och hemspråk, och för Sveriges nationella minoritetsspråk.[27]
För internetorganisationen IETF:s språkkoder, som är baserade bland annat på ISO 639 (del 1, 2, 3),[28] kan en språkkod från ISO 639 kombineras med en landskod från ISO 3166 för att specificera en lokal variant av ett språk, exempelvis ”fr-CH” för språket franska i landet Schweiz, om behovet finns att skilja det från franska i Frankrike (”fr-FR”) eller Kanada (”fr-CA”). I detta fall kan en språkkod även kombineras med en skriptkod från ISO 15924 för att för skriftspråk ange vilket skriftsystem som används. Detta används främst för språk som ofta skrivs i olika skriftsystem, till exempel serbiska, som alternativt skrivs med latinska bokstäver (”sr-Latn”) eller med kyrilliska bokstäver (”sr-Cyrl”).[28]
Eftersom även World Wide Web Consortium använder ISO 639-1 i standarden HTML så är den oerhört central för språkidentifiering av sidor på internet.[29]
Omfattning och omfång
redigeraISO 639-3 delar in språkkoderna i klasser (engelska: scope) efter kodens funktion, som individuellt språk, makrospråk eller specialkod.[30] Till dessa klasser tillkommer ISO 639-5 med språkgrupper och språkfamiljer. Eftersom koderna i del 2 har en motsvarighet antingen i del 3 eller 5 så kan även de klassificeras enligt ovanstående schema. Detsamma gäller koderna i del 1, som definierar en delmängd av koderna i del 2.
Antalet koder varierar, främst för att nya koder tillkommer i del 3.[31] Enligt den 2022 aktuella datan i de registeransvariga institutionernas databaser för del 2,[23] del 3,[30] och del 5[32] så är följande antal koder definierade:
Klass | ISO 639-1 | ISO 639-2 | ISO 639-3 | ISO 639-5 | Kommentar |
---|---|---|---|---|---|
Individuellt språk | 149 | 359 | 7 844 | Indelning enligt ISO 639-3 | |
Makrospråk | 34 | 58 | 62 | ||
Specialkoder | 4 | 4 | |||
Språkgrupper | 1 | 65 | 115 | Inklusive språkfamiljer | |
Summa | 184 | 486 | 7 910 | 115 | |
Reserverade koder | 520 | 659 | Koder specifika för ISO 639-2 (B) och ISO 639-5 är reserverade i ISO 639-3 | ||
Alternativa koder | 20 | De koder som är unika för ISO 6339-2 (B) | |||
Utfasade koder | 6 | 4 | 368 | Serbokroatiska är utfasad i del 1, men kvar i del 3 (makrospråk). | |
Outnyttjade koder | 486 | 16 641 | 8 639 | 17 461 | Koder som hittills inte har blivit tilldelade språk |
Totalt | 676 | 17 576 | 17 576 | 17 576 |
Koder från ISO 639-1
redigeraSe även
redigera- Lista över språkkoder i ISO 639
- Systematisk lista över språk
- ISO 15924 – Anger koder för namn på skriftsystem.
- ISO 3166 – Anger koder för namn på länder.
Anmärkningar
redigera- ^ Libris har dock lagt till tre egna koder för forndanska (9fd), fornsvenska (9fs) och fornlågtyska (9ft).
- ^ Sichuan yi: prestigespråket bland yispråken
- ^ Luba-katanga: bantuspråk; se även Luba (folkslag)
- ^ Twi: närbesläktat med, eller dialekt av, akan
Källor
redigeraFör listan över ISO 639-1-koder
redigeraListan är senast uppdaterad i juni 2022, med data från följande källor:
- ISO 639-2 Registration Authority (21 december 2017). ”Codes for the Representation of Names of Languages – Codes arranged alphabetically by alpha-3/ISO 639-2 Code” (på engelska). ISO 639-2. Library of Congress. https://www.loc.gov/standards/iso639-2/php/code_list.php. Läst 20 juni 2022.
- ISO 639-3 Registration Authority (2022). ”ISO 639-3 Downloads” (på engelska). ISO 639-3. SIL International. https://iso639-3.sil.org/code_tables/download_tables. Läst 20 juni 2022.
- ISO 639-3 Registration Authority (2022). ”ISO 639 Code Tables” (på engelska). ISO 639-3. SIL International. https://iso639-3.sil.org/code_tables/639/data. Läst 20 juni 2022.
- ISO 639-5 Registration Authority (11 februari 2013). ”Codes for the Representation of Names of Languages – Part 5: Alpha-3 code for language families and groups – ISO 639-5 codes ordered by Identifier” (på engelska). ISO 639-5. Library of Congress. https://www.loc.gov/standards/iso639-5/id.php. Läst 20 juni 2022.
Fotnoter
redigera- ^ [a b] ”ISO 639 languages codes” (på engelska). iso.org. Internationella standardiseringsorganisationen. https://www.iso.org/iso-639-language-codes.html. Läst 16 juni 2022.
- ^ [a b c d] ”Maintenance Agencies and Registration Authorities” (på engelska). iso.org. ISO. https://www.iso.org/maintenance_agencies.html. Läst 16 juni 2022.
- ^ ”Another Russian Launch to Celebrate” (på engelska). iso.org. ISO. https://www.iso.org/news/ref2219.html. Läst 16 juni 2022.
- ^ [a b c d] ”ISO 639-1:2002 Codes for the representation of names of languages — Part 1: Alpha-2 code” (på engelska). iso.org. ISO. https://www.iso.org/standard/22109.html. Läst 16 juni 2022.
- ^ ”ISO 639-1:2002 Codes pour la représentation des noms de langue — Partie 1: Code alpha-2” (på franska). iso.org. ISO. https://www.iso.org/fr/standard/22109.html. Läst 16 juni 2022.
- ^ ”Wer wir sind” (på tyska). austrian-standards.at. Austrian Standards International. https://www.austrian-standards.at/de/wir-unser-netzwerk/wer-wir-sind. Läst 16 juni 2022.
- ^ [a b c] ”ISO 639-2:1998 Codes for the representation of names of languages — Part 2: Alpha-3 code” (på engelska). iso.org. ISO. https://www.iso.org/standard/4767.html. Läst 16 juni 2022.
- ^ ”ISO 639-2:1998 Codes pour la représentation des noms de langue — Partie 2: Code alpha-3” (på franska). iso.org. ISO. https://www.iso.org/fr/standard/4767.html. Läst 16 juni 2022.
- ^ [a b] ”Codes for the Representation of Names of Languages – Codes arranged alphabetically by alpha-3/ISO 639-2 Code” (på engelska). loc.gov. USA:s kongressbibliotek. 21 december 2017. https://www.loc.gov/standards/iso639-2/php/code_list.php. Läst 16 juni 2022.
- ^ [a b] ”ISO 639-5” (på engelska). loc.gov. USA:s kongressbibliotek. 18 februari 2009. https://www.loc.gov/standards/iso639-5/. Läst 16 juni 2022.
- ^ [a b c d] ”ISO 639-3:2007 Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages” (på engelska). iso.org. ISO. https://www.iso.org/standard/39534.html. Läst 16 juni 2022.
- ^ ”ISO 639-3:2007 Codes pour la représentation des noms de langues — Partie 3: Code alpha-3 pour un traitement exhaustif des langues” (på franska). iso.org. ISO. https://www.iso.org/fr/standard/39534.html. Läst 16 juni 2022.
- ^ [a b] ”Relationship between ISO 639-3 and the other parts of ISO 639” (på engelska). iso639-3.sil.org. SIL International. 2022. https://iso639-3.sil.org/about/relationships. Läst 16 juni 2022.
- ^ [a b c d e] ”ISO 639-4:2010 Codes for the representation of names of languages — Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines” (på engelska). iso.org. ISO. https://www.iso.org/standard/39535.html. Läst 16 juni 2022.
- ^ ”ISO 639-4:2010 Codes pour la représentation des noms de langue — Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre” (på franska). iso.org. ISO. https://www.iso.org/fr/standard/39535.html. Läst 16 juni 2022.
- ^ [a b c d e] ”ISO 639-5:2008 Codes for the representation of names of languages — Part 5: Alpha-3 code for language families and groups hämtdatum=2022-06-16” (på engelska). iso.org. ISO. https://www.iso.org/standard/39536.html.
- ^ ”ISO 639-5:2008 Codes pour la représentation des noms de langue — Partie 5: Code alpha-3 pour les familles de langues et groupes de langues” (på franska). iso.org. ISO. https://www.iso.org/fr/standard/39536.html. Läst 16 juni 2022.
- ^ Tsunduku (23 december 2021). ”Full list of ISO-639-6” (på engelska). linguistics.stackexchange.com. https://linguistics.stackexchange.com/questions/43379/full-list-of-iso-639-6. Läst 18 juni 2022. Refererar till denna kungörelse från Peter Constable, ledamot i ISO/TC 37/SC2: FYI: withdrawal of ISO 639-6.
- ^ [a b c] ”ISO 639-5” (på engelska). www.loc.gov/standards/iso639-5/. USA:s kongressbibliotek. 18 februari 2009. https://www.loc.gov/standards/iso639-5/. Läst 17 juni 2022.
- ^ ”Codes for the Representation of Names of Languages Part 5: Alpha-3 code for language families and groups” (på engelska). www.loc.gov/standards/iso639-5/. USA:s kongressbibliotek. 18 februari 2009. https://www.loc.gov/standards/iso639-5/langhome5.html. Läst 17 juni 2022.
- ^ ”ISO 639-3 – Scope of denotation for language identifier” (på engelska). ISO 639-3. SIL International. 2022. https://iso639-3.sil.org/about/scope. Läst 17 juni 2022.
- ^ ”ISO 639 Code Tables” (på engelska). ISO 639-3. SIL International. 2022. https://iso639-3.sil.org/code_tables/639/data?title=&field_iso639_cd_st_mmbrshp_639_1_tid=All&name_3=&field_iso639_element_scope_tid=76&field_iso639_language_type_tid=All&items_per_page=200. Läst 17 juni 2022.
- ^ [a b] ”Codes for the Representation of Names of Languages – Codes arranged alphabetically by alpha-3/ISO 639-2 Code” (på engelska). ISO 639-2. Library o Congress. 21 december 2017. https://www.loc.gov/standards/iso639-2/php/code_list.php. Läst 17 juni 2022.
- ^ [a b c] ”Scope of denotation for language identifiers” (på engelska). ISO 639-3. SIL International. 2022. https://iso639-3.sil.org/about/scope. Läst 18 juni 2022.
- ^ [a b] ”Förteckning över språkkoder i MARC21”. Här finns information om katalogisering, metadata, fjärrlån och annat som Librisbiblioteken behöver veta.. Kungliga biblioteket. Arkiverad från originalet den 30 juli 2021. https://web.archive.org/web/20210730051512/http://www.libris.kb.se/tjanster/katalogisering/formathandbok/sprakkoder.htm. Läst 17 juni 2022.
- ^ ”ISO 639-5 codes ordered by Hierarchy” (på engelska). ISO 639-5. Library o Congress. 11 februari 2013. https://www.loc.gov/standards/iso639-5/hier.php. Läst 17 juni 2022.
- ^ ”Språkkoder” (XLSX). scb.se. Statistiska centralbyrån. 6 december 2021. https://www.scb.se/contentassets/221c69e399f0424b852b21236952e300/sprakkoder.xlsx. Läst 17 juni 2022.
- ^ [a b] A. Phillips & M. Davis (redaktörer) (september 2009). ”Tags for Identifying Languages” (på engelska) (text (ASCII)). IETF. https://datatracker.ietf.org/doc/html/rfc5646. Läst 18 juni 2022.
- ^ ”ISO 639-1 Language Codes” (på engelska). w3schools.com. World Wide Web Consortium. https://www.w3schools.com/tags/ref_language_codes.asp. Läst 18 juni 2022.
- ^ [a b] ”ISO 639-3 Downloads” (på engelska). iso639-3.sil.org. SIL. 2022. https://iso639-3.sil.org/code_tables/download_tables#Complete%20Code%20Tables. Läst 18 juni 2022.
- ^ ”Change Request Index” (på engelska). iso639-3.sil.org. SIL. 2022. https://iso639-3.sil.org/code_changes/change_request_index/data. Läst 18 juni 2022.
- ^ ”ISO 639-5 codes ordered by Identifier” (på engelska). ISO 639-5. Library o Congress. 11 februari 2013. https://www.loc.gov/standards/iso639-5/id.php. Läst 18 juni 2022.