Table des caractères Unicode/U0300
Table des caractères Unicode U+0300 à U+036F (768 à 879 en décimal).
Diacritiques (Unicode 1.0.0 à 4.1)
modifierUtilisés comme signes diacritiques se combinant avec le caractère qu’ils suivent. Ces signes sont ici présentés combinés à la lettre latine minuscule « o » (U+006F) à des fins de lisibilité, ou bien pour quelques uns (signalés en note au survol) avec la lettre latine minuscule « c » (U+0063). Ils ne sont toutefois pas réservés seulement pour l’écriture latine, mais aussi utilisés pour les écritures grecque, copte et cyrillique (et parfois pour d’autres écritures, à moins qu’elles disposent de diacritiques spécifiques à celles-ci).
Note : certaines combinaisons, bien que valides selon Unicode, ne s'affichent pas correctement avec de nombreuses polices (notamment pour les diacritiques couvrants U+0334 à U+0338 qui peuvent sembler décentrés vers la droite). Il est recommandé d'utiliser dans les documents les lettres ou symboles précombinés (en forme équivalente normalisée canonique NFC) équivalentes quand ces caractères existent dans Unicode pour les alphabets latins, grecs, coptes et cyrilliques ou pour les symboles, car de nombreuses polices de caractères ou différents moteurs de rendus de texte peuvent ne pas les reconnaître et donner un rendu approximatif. Toutefois leur emploi en combinaison avec des symboles et lettres symboliques pour les notations mathématiques reste souvent la seule solution possible.
Les diacritiques dits « doubles » U+035C à U+0362, couramment utilisées dans les notations phonétiques ou grammaticales, sont des variantes élargies des diacritiques simples correspondants ; ils doivent être codés dans les textes entre deux lettres de base (après les diacritiques s'appliquant seulement à la première lettre). Dans la table ci-dessous ils sont codés entre deux lettres latines minuscules « o » à des fins de lisibilité (ces signes diacritiques devraient apparaître centrés entre les deux lettres). Il est vivement recommandé d'utiliser ces diacritiques doubles plutôt que les « demi-diacritiques » codant séparément (après chaque lettre ou symbole de base) soit la moitié gauche soit la moitié droite, quand de tels diacritiques ne recouvrent que deux lettres ou symboles de base.
Table des caractères
modifier en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0300 | ò | ó | ô | õ | ō | o̅ | ŏ | ȯ | ö | ỏ | o̊ | ő | ǒ | o̍ | o̎ | ȍ |
U+0310 | o̐ | ȏ | o̒ | o̓ | o̔ | o̕ | o̖ | o̗ | o̘ | o̙ | o̚ | ơ | o̜ | o̝ | o̞ | o̟ |
U+0320 | o̠ | c̡ | c̢ | ọ | o̤ | o̥ | c̦ | ç | ǫ | o̩ | o̪ | o̫ | o̬ | o̭ | o̮ | o̯ |
U+0330 | o̰ | o̱ | o̲ | o̳ | o̴ | o̵ | o̶ | o̷ | o̸ | o̹ | o̺ | o̻ | o̼ | o̽ | o̾ | o̿ |
U+0340 | ò | ó | o͂ | o̓ | ö́ | oͅ | o͆ | o͇ | o͈ | o͉ | o͊ | o͋ | o͌ | o͍ | o͎ | CGJ |
U+0350 | o͐ | o͑ | o͒ | o͓ | o͔ | o͕ | o͖ | o͗ | o͘ | o͙ | o͚ | o͛ | o͜o | o͝o | o͞o | o͟o |
U+0360 | o͠o | o͡o | o͢o | oͣ | oͤ | oͥ | oͦ | oͧ | oͨ | oͩ | oͪ | oͫ | oͬ | oͭ | oͮ | oͯ |
Historique
modifierVersion initiale Unicode 1.0.0
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0300 | ò | ó | ô | õ | ō | o̅ | ŏ | ȯ | ö | ỏ | o̊ | ő | ǒ | o̍ | o̎ | ȍ |
U+0310 | o̐ | ȏ | o̒ | o̓ | o̔ | o̕ | o̖ | o̗ | o̘ | o̙ | o̚ | ơ | o̜ | o̝ | o̞ | o̟ |
U+0320 | o̠ | c̡ | c̢ | ọ | o̤ | o̥ | c̦ | ç | ǫ | o̩ | o̪ | o̫ | o̬ | o̭ | o̮ | o̯ |
U+0330 | o̰ | o̱ | o̲ | o̳ | o̴ | o̵ | o̶ | o̷ | o̸ | o̹ | o̺ | o̻ | o̼ | o̽ | o̾ | o̿ |
U+0340 | ò | ó | o͂ | o̓ | ö́ | oͅ | ||||||||||
U+0350 | ||||||||||||||||
U+0360 |
Compléments Unicode 1.1
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0360 | o͠o | o͡o |
Compléments Unicode 3.0
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0340 | o͆ | o͇ | o͈ | o͉ | o͊ | o͋ | o͌ | o͍ | o͎ | |||||||
U+0360 | o͢o |
Compléments Unicode 3.2
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0340 | CGJ | |||||||||||||||
U+0360 | oͣ | oͤ | oͥ | oͦ | oͧ | oͨ | oͩ | oͪ | oͫ | oͬ | oͭ | oͮ | oͯ |
Compléments Unicode 4.0
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0350 | o͐ | o͑ | o͒ | o͓ | o͔ | o͕ | o͖ | o͗ | o͝o | o͞o | o͟o |
Compléments Unicode 4.1
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0350 | o͘ | o͙ | o͚ | o͛ | o͜o |
Voir aussi
modifierLiens externes
modifier- (en) [PDF] Combining Diacritical Marks, tableau sur le site Unicode.
- (fr) [PDF] Diacritiques, tableau sur le site Unicode.
Articles connexes
modifier- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Latin étendu – extensions phonétiques
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Exposants et indices
- Symboles de type lettre
- Formes numérales
- Opérateurs mathématiques
- Alphanumériques cerclés
- Latin étendu – C
- Lettres modificatives de ton
- Latin étendu – D
- Latin étendu – E
- Formes de présentation alphabétiques
- Demi-signes combinatoires
- Formes de demi et pleine chasse
- Latin étendu – F
- Symboles antiques
- Supplément alphanumérique cerclé
- Latin étendu – G
- Diacritiques
- Diacritiques pour symboles
- Flèches
- Signes techniques divers
- Symboles divers
- Casseau
- Flèches – supplément – A
- Flèches – supplément – B
- Symboles mathématiques divers – B
- Symboles symboles et flèches divers
- Lettres modificatives de ton
- Formes de demi et pleine chasse
- Symboles et pictogrammes divers
- Flèches – supplément C
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte (codage Unicode 1.0.0 partiellement obsolète, car 13 caractères ont ensuite été supprimés ou redéfinis dans Unicode 1.1, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.0)
- Cyrillique (codage Unicode 1.0.0 partiellement obsolète, car 4 caractères ont ensuite été supprimés dans Unicode 1.1), même si ces caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Lao (ou laotien) (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Tibétain (codage Unicode 1.0.0 obsolète, car tous ces caractères initialement définis de U-1000 à U-104F ont ensuite été supprimés dans Unicode 1.1 (remplacé en Unicode 3.0 par le bloc « Birman » ; les caractères tibétains ont ensuite été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0)
- Géorgien – assomtavrouli et mkhédrouli
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers (codage Unicode 1.0.0 partiellement obsolète, car 2 caractères ont ensuite été supprimés dans Unicode 1.0.1)
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Hangûl (ou hangeul) – syllabes coréennes (codage Unicode 1.0.0 partiellement obsolète, car tous ces caractères ont été initialement publiés sans noms standardisé qui ont ensuite été définis dans Unicode 1.1)
- Zone à usage privée (codage Unicode 1.0.0 partiellement obsolète, car le bloc initialement défini de U+E800 à U-FDFF a ensuite été réajusté de U+E000 à U-F7FF dans un erratum publié en annexe dans Unicode 1.0.1)
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux (codage Unicode 1.0.0 partiellement obsolète, car 1 caractère a été initialement codé dans Unicode 1.0.0 avec un nom standardisé qui a ensuite été modifié dans Unicode 1.0.1)
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Nouveaux blocs ajoutés :
- Syriaque
- Thâna
- Birman
- Éthiopien
- Chérokie
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Singhalais
- Motifs Braille
- Sinogrammes unifiés CJC – caractères de description
- Symboles et ponctuation CJC
- Bopomofo étendu
- Sinogrammes unifiés CJC – supplément A :
1re partie, 2e partie - Yi – syllabaire des Monts frais
- Yi – clés
- ...
Nouveaux caractères dans des blocs existants :
Nouveaux blocs ajoutés :
- Cyrillique – supplément
- Tagalog (ou baybayin, alibata)
- Hanounóo
- Bouhide (ou bouhid)
- Tagbanoua (ou tagbanwa)
- Flèches – supplément – A
- Flèches – supplément – B
- Symboles mathématiques divers – B
- Symboles mathématiques – supplément
- Katakana – extensions phonétiques
- Sélecteurs de variantes
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Diacritiques
- Grec et copte
- Cyrillique
- Arabe
- Thâna
- Géorgien – assomtavrouli et mkhédrouli
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Diacritiques pour symboles
- Symboles de type lettre
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Alphanumériques délimités
- Pavés
- Symboles divers
- Symboles mathématiques divers – A
- Formes géométriques
- Symboles et ponctuation CJC
- Hiragana
- Katakana
- Lettres et mois CJC délimités
- Yi – clés
- Sinogrammes de compatibilité CJC
- Arabe – formes de présentation – A (3e partie)
- Sinogrammes CJC – formes de compatibilité
- Arabe – formes de présentation – B
- Formes de demi et pleine chasse
Nouveaux blocs ajoutés :
- Limbou
- Latin étendu – extensions phonétiques
- Linéaire B – syllabaire
- Linéaire B – idéogrammes
- Grec – nombres égéens
- Ougaritique
- Shavien
- Osmanya
- Sélecteurs de variante – supplément
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Arabe
- Syriaque
- Dévanagârî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Kannara (ou kannada)
- Khmer (ou cambodgien)
- Ponctuation générale
- Signes techniques divers
- Lettres et mois CJC délimités
Nouveaux blocs ajoutés :
- Arabe – supplément
- Éthiopien – supplément
- Nouveau taï lü
- Bougui (ou bouguinais, bugi, lontara)
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Géorgien – supplément (nouskhouri)
- Éthiopien étendu
- Sinogrammes unifiés CJC – traits
- Lettres modificatives de ton
- Grec – nombres antiques
- Cunéiforme persépolitain (vieux perse)
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Diacritiques
- Grec et copte
- Cyrillique
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Tamoul
- Tibétain
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Latin étendu – extensions phonétiques
- Symboles monétaires
- Signes techniques divers
- Lettres et mois unifiés CJC délimités
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- ...
Notes et références
modifier- Reconstructed UnicodeData.txt (1.0.0), base de données sur le site Unicode.
- DerivedAge.txt, base de données sur le site Unicode.