Código de script indiano para intercâmbio de informações - Indian Script Code for Information Interchange
O Código de Script Indiano para Intercâmbio de Informações ( ISCII ) é um esquema de codificação para representar vários sistemas de escrita da Índia . Ele codifica as principais escritas índicas e uma transliteração romana. Os scripts suportados são: Assamês , Bengali (Bangla) , Devanagari , Gujarati , Gurmukhi , Kannada , Malayalam , Oriya , Tamil e Telugu . O ISCII não codifica os sistemas de escrita da Índia baseados no persa , mas seus códigos de troca de sistema de escrita fornecem, no entanto, para Caxemira , Sindi , Urdu , Persa , Pashto e Árabe . Os sistemas de escrita baseados em persa foram subsequentemente codificados na codificação PASCII .
O ISCII não foi amplamente usado fora de certas instituições governamentais, embora uma variante sem o mecanismo ATR tenha sido usada no Mac OS clássico e agora tenha se tornado amplamente obsoleto pelo Unicode . O Unicode usa um bloco separado para cada sistema de escrita índico e preserva amplamente o layout ISCII dentro de cada bloco.
Fundo
Os sistemas de escrita derivados de Brahmi têm estrutura semelhante. Portanto, o ISCII codifica letras com o mesmo valor fonético no mesmo ponto de código, sobrepondo os vários scripts. Por exemplo, os códigos ISCII 0xB3 0xDB representam [ki]. Será traduzido como കി em Malayalam , कि em Devanagari, como ਕਿ em Gurmukhi e como கி em Tamil. O sistema de escrita pode ser selecionado em rich text por marcação ou em texto simples por meio do código ATR descrito a seguir.
Uma motivação para o uso de uma única codificação é a ideia de que ela permitirá uma fácil transliteração de um sistema de escrita para outro. No entanto, existem incompatibilidades suficientes para que esta não seja realmente uma ideia prática.
ISCII é uma codificação de 8 bits. Os 128 pontos de código inferiores são ASCII simples , os 128 pontos de código superiores são específicos do ISCII. Além dos pontos de código que representam caracteres, o ISCII usa um ponto de código com ATR mnemônico que indica que o byte a seguir contém um dos dois tipos de informação. Um conjunto de valores muda o sistema de escrita até o próximo indicador ou fim de linha do sistema de escrita. Outro conjunto de valores seleciona os modos de exibição, como negrito e itálico. O ISCII não fornece um meio de indicar o sistema de gravação padrão.
Layout de página de código
A tabela a seguir mostra o conjunto de caracteres para Devanagari . Os conjuntos de códigos para Assamês, Bengali, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamil e Telugu são semelhantes, com cada forma Devanagari substituída pela forma equivalente em cada sistema de escrita . Cada caractere é mostrado com seu código decimal e seu equivalente Unicode .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UMA | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
STX 0002 |
ETX 0003 |
EOT 0004 |
ENQ 0005 |
ACK 0006 |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
DC4 0014 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
a 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
eu 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
||||||||||||||||
9_ 144 |
||||||||||||||||
A_ 160 |
ँ 0901 |
ं 0902 |
ः 0903 |
अ 0905 |
आ 0906 |
इ 0907 |
ई 0908 |
उ 0909 |
ऊ 090A |
ऋ 090B |
ऎ 090E |
ए 090F |
ऐ 0910 |
ऍ 090D |
ऒ 0912 |
|
B_ 176 |
ओ 0913 |
औ 0914 |
ऑ 0911 |
क 0915 |
ख 0916 |
ग 0917 |
घ 0918 |
ङ 0919 |
च 091A |
छ 091B |
ज 091C |
झ 091D |
ञ 091E |
ट 091F |
ठ 0920 |
ड 0921 |
C_ 192 |
ढ 0922 |
ण 0923 |
त 0924 |
थ 0925 |
द 0926 |
ध 0927 |
न 0928 |
ऩ 0929 |
प 092A |
फ 092B |
ब 092C |
भ 092D |
म 092E |
य 092F |
य़ 095F |
र 0930 |
D_ 208 |
ऱ 0931 |
ल 0932 |
ळ 0933 |
ऴ 0934 |
व 0935 |
श 0936 |
ष 0937 |
स 0938 |
ह 0939 |
INV |
ा 093E |
ि 093F |
ी 0940 |
ु 0941 |
ू 0942 |
ृ 0943 |
E_ 224 |
ॆ 0946 |
े 0947 |
ै 0948 |
ॅ 0945 |
ॊ 094A |
ो 094B |
ौ 094C |
ॉ 0949 |
् 094D |
़ 093C |
। 0964 |
ATR |
||||
F_ 240 |
EXT |
० 0966 |
१ 0967 |
२ 0968 |
३ 0969 |
४ 096A |
५ 096B |
६ 096C |
७ 096D |
८ 096E |
९ 096F |
Carta Número Pontuação Símbolo Outro Indefinido
Pontos de código especiais
- Caractere INV - ponto de código D9 (217)
- O caractere INV (consoante invisível) é usado como uma pseudo-consoante para exibir elementos combinados de forma isolada. Por exemplo, क (ka) + ् (halant) + INV = क् (meio ka). O equivalente Unicode é U + 200D ZERO WIDTH JOINER ( ZWJ ). No entanto, conforme observado abaixo , o caractere halant ISCII pode ser duplicado ou combinado com o nukta ISCII para obter efeitos criados por ZWNJ ou ZWJ em Unicode. Por esta razão, a Apple mapeia o caráter ISCII INV para o Unicode da esquerda para a direita marca , de modo a garantir -tropeçando rodada .
- Caractere ATR - ponto de código EF (239)
- O caractere ATR (atributo) seguido por um código de byte é usado para alternar para um atributo de fonte diferente (como negrito) ou para um idioma ISCII ou PASCII diferente (como bengali), até a próxima sequência ATR ou o final do linha. Não tem equivalente Unicode direto, pois os atributos de fonte não fazem parte do Unicode e cada script tem um conjunto distinto de pontos de código.
ATR + byte | Mnemônico | Opção de formatação |
---|---|---|
0x30 | BLD | Negrito |
0x31 | ITA | Itálico |
0x32 | UL | Sublinhado |
0x33 | EXP | Expandido |
0x34 | HLT | Realçar |
0x35 | OTL | Contorno |
0x36 | SHD | Sombra |
0x37 | PRINCIPAL | Metade superior do caractere (usado com LOW para criar caracteres de altura dupla) |
0x38 | BAIXO | Metade inferior do caractere (usado com TOP para criar caracteres de altura dupla) |
0x39 | DBL | Linha inteira de largura dupla e altura dupla |
ATR + byte | Mnemônico | Script ISCII |
---|---|---|
0x40 | DEF | Script padrão (ou seja, o script que será alterado de volta após uma quebra de linha) |
0x41 | RMN | Transliteração romanizada |
0x42 | DEV | Devanágari |
0x43 | BNG | Escrita bengali |
0x44 | TML | Escrita Tamil |
0x45 | TLG | Escrita telugu |
0x46 | ASM | Script assamês |
0x47 | ORI | Roteiro Odia |
0x48 | KND | Escrita canarim |
0x49 | MLM | Escrita malaiala |
0x4A | GJR | Script guzerate |
0x4B | PNJ | Gurmukhī |
ATR + byte | Mnemônico | Localidade PASCII |
---|---|---|
0x71 | ARB | Alfabeto árabe |
0x72 | PES | Alfabeto persa |
0x73 | URD | Alfabeto urdu |
0x74 | SND | Alfabeto sindi |
0x75 | KSM | Alfabeto da Caxemira |
0x76 | PST | Alfabeto pashto |
- Caractere EXT - ponto de código F0 (240)
- O caractere EXT (extensões para Védico) seguido por um código de byte indica um sotaque Védico. Não tem equivalente Unicode direto, pois os acentos védicos são atribuídos a pontos de código distintos.
- Caráter Halant ्— ponto de código E8 (232)
- O caractere halant remove a vogal implícita de uma consoante e é usado entre consoantes para representar consoantes conjuntas. Por exemplo, क (ka) + ् (halant) + त (ta) = क्त (kta). A sequência ् (halant) + ् (halant) exibe um conjunto com um halant explícito, por exemplo क (ka) + ् (halant) + ् (halant) + त (ta) = क्त. A sequência ् (halant) + ़ (nukta) exibe um conjunto com meias consoantes, se disponível, por exemplo क (ka) + ् (halant) + ़ (nukta) + त (ta) = क्त.
ISCII | Unicode | ||
---|---|---|---|
halante único | E8 |
halant |
094D
|
halante + halante | E8 E8 |
halant + ZWNJ |
094D 200C
|
halant + nukta | E8 E9 |
halant + ZWJ |
094D 200D
|
- Caractere Nukta ़— ponto de código E9 (233)
- O caractere nukta após outro caractere ISCII é usado para uma série de caracteres mais raros que não existem no conjunto ISCII principal. Por exemplo, क (ka) + ़ (nukta) = क़ (qa). Esses caracteres têm formas pré-compostas em Unicode, conforme mostrado na tabela a seguir.
Ponto de código ISCII |
Personagem original |
Personagem com nukta |
Ponto de código Unicode |
---|---|---|---|
A1 (161) | ँ | ॐ | 0950 |
A6 (166) | इ | ऌ | 090C |
A7 (167) | ई | ॡ | 0961 |
AA (176) | ऋ | ॠ | 0960 |
B3 (179) | क | क़ | 0958 |
B4 (180) | ख | ख़ | 0959 |
B5 (181) | ग | ग़ | 095A |
BA (186) | ज | ज़ | 095B |
BF (191) | ड | ड़ | 095C |
C0 (192) | ढ | ढ़ | 095D |
C9 (201) | फ | फ़ | 095E |
DB (219) | ि | ॢ | 0962 |
DC (220) | ी | ॣ | 0963 |
DF (223) | ृ | ॄ | 0944 |
EA (234) | । | ऽ | 093D |
Páginas de código para conversão ISCII
Para converter de Unicode (UTF-8) em uma codificação ISCII / ANSI, as seguintes páginas de código podem ser usadas:
- 57002: Devanágari (hindi, marati, sânscrito, concani)
- 57003: bengali
- 57004: Tamil
- 57005: Telugu
- 57006: assamês
- 57007: Odia
- 57008: Kannada
- 57009: Malayalam
- 57010: Gujarati
- 57011: Punjabi (Gurmukhi)
Pontos de código para todos os idiomas
Hex | Lista Oficial |
ISO 15919 | Devanágari | bengali | Assamês | Gurmukhi | Guzerate | Oriya | tâmil | Telugu | Canarim | Malaiala | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A0 | Assinar OM | ॐ | 0950 | ૐ | 0AD0 | |||||||||||||||||
A1 | Modificador vocálico CHANDRABINDU | ँ | 0901 | ঁ | 0981 | ঁ | 0981 | ਁ | 0A01 | ઁ | 0A81 | ଁ | 0B01 | ఁ | 0C01 | |||||||
A2 | Modificador de vogal ANUSWARAM | ṁ | ं | 0902 | ং | 0982 | ং | 0982 | ਂ | 0A02 | ં | 0A82 | ଂ | 0B02 | ஂ | 0B82 | ం | 0C02 | ಂ | 0C82 | ം | 0D02 |
A3 | Vogal modificador VISARGAM | ḥ | ः | 0903 | ঃ | 0983 | ঃ | 0983 | ਃ | 0A03 | ઃ | 0A83 | ଃ | 0B03 | ஃ | 0B83 | ః | 0C03 | ಃ | 0C83 | ഃ | 0D03 |
A4 | Vogal A | uma | अ | 0905 | অ | 0985 | অ | 0985 | ਅ | 0A05 | અ | 0A85 | ଅ | 0B05 | அ | 0B85 | అ | 0C05 | ಅ | 0C85 | അ | 0D05 |
A5 | Vogal AA | uma | आ | 0906 | আ | 0986 | আ | 0986 | ਆ | 0A06 | આ | 0A86 | ଆ | 0B06 | ஆ | 0B86 | ఆ | 0C06 | ಆ | 0C86 | ആ | 0D06 |
A6 | Vogal I | eu | इ | 0907 | ই | 0987 | ই | 0987 | ਇ | 0A07 | ઇ | 0A87 | ଇ | 0B07 | இ | 0B87 | ఇ | 0C07 | ಇ | 0C87 | ഇ | 0D07 |
A6 * | Vogal LI (sânscrito) | eu | ऌ | 090C | ঌ | 098C | ঌ | 098C | ઌ | 0A8C | ଌ | 0B0C | ఌ | 0C0C | ಌ | 0C8C | ഌ | 0D0C | ||||
A7 | Vogal II | eu | ई | 0908 | ঈ | 0988 | ঈ | 0988 | ਈ | 0A08 | ઈ | 0A88 | ଈ | 0B08 | ஈ | 0B88 | ఈ | 0C08 | ಈ | 0C88 | ഈ | 0D08 |
A7 * | Vogal LII (sânscrito) | eu | ॡ | 0961 | ৡ | 09E1 | ৡ | 09E1 | ૡ | 0AE1 | ୡ | 0B61 | ౡ | 0C61 | ೡ | 0CE1 | ൡ | 0D61 | ||||
A8 | Vogal U | você | उ | 0909 | উ | 0989 | উ | 0989 | ਉ | 0A09 | ઉ | 0A89 | ଉ | 0B09 | உ | 0B89 | ఉ | 0C09 | ಉ | 0C89 | ഉ | 0D09 |
A9 | Vogal UU | você | ऊ | 090A | ঊ | 098A | ঊ | 098A | ਊ | 0A0A | ઊ | 0A8A | ଊ | 0B0A | ஊ | 0B8A | ఊ | 0C0A | ಊ | 0C8A | ഊ | 0D0A |
AA | Vogal RI | r̥ | ऋ | 090B | ঋ | 098B | ঋ | 098B | ઋ | 0A8B | ଋ | 0B0B | ఋ | 0C0B | ಋ | 0C8B | ഋ | 0D0B | ||||
AA * | Vogal RII (sânscrito) | ṝ | ॠ | 0960 | ৠ | 09E0 | ৠ | 09E0 | ૠ | 0AE0 | ୠ | 0B60 | ౠ | 0C60 | ೠ | 0CE0 | ൠ | 0D60 | ||||
AB | Vogal E (scripts do sul) | e | ऎ | 090E | எ | 0B8E | ఎ | 0C0E | ಎ | 0C8E | എ | 0D0E | ||||||||||
AC | Vogal EY | ē | ए | 090F | এ | 098F | এ | 098F | ਏ | 0A0F | એ | 0A8F | ଏ | 0B0F | ஏ | 0B8F | ఏ | 0C0F | ಏ | 0C8F | ഏ | 0D0F |
DE ANÚNCIOS | Vogal AI | ai | ऐ | 0910 | ঐ | 0990 | ঐ | 0990 | ਐ | 0A10 | ઐ | 0A90 | ଐ | 0B10 | ஐ | 0B90 | ఐ | 0C10 | ಐ | 0C90 | ഐ | 0D10 |
AE | Vogal AYE (escrita Devanágari) | ê | ऍ | 090D | ઍ | 0A8D | ||||||||||||||||
AF | Vogal O (scripts do sul) | o | ऒ | 0912 | ஒ | 0B92 | ఒ | 0C12 | ಒ | 0C92 | ഒ | 0D12 | ||||||||||
B0 | Vogal OW | ō | ओ | 0913 | ও | 0993 | ও | 0993 | ਓ | 0A13 | ઓ | 0A93 | ଓ | 0B13 | ஓ | 0B93 | ఓ | 0C13 | ಓ | 0C93 | ഓ | 0D13 |
B1 | Vogal AU | au | औ | 0914 | ঔ | 0994 | ঔ | 0994 | ਔ | 0A14 | ઔ | 0A94 | ଔ | 0B14 | ஔ | 0B94 | ఔ | 0C14 | ಔ | 0C94 | ഔ | 0D14 |
B2 | Vogal AWE (escrita Devanágari) | ô | ऑ | 0911 | ઑ | 0A91 | ||||||||||||||||
B3 | Consoante KA | k | क | 0915 | ক | 0995 | ক | 0995 | ਕ | 0A15 | ક | 0A95 | କ | 0B15 | க | 0B95 | క | 0C15 | ಕ | 0C95 | ക | 0D15 |
B3 * | Consoante QA (Urdu) | q | क़ | 0958 | ||||||||||||||||||
B4 | Consoante KHA | kh | ख | 0916 | খ | 0996 | খ | 0996 | ਖ | 0A16 | ખ | 0A96 | ଖ | 0B16 | ఖ | 0C16 | ಖ | 0C96 | ഖ | 0D16 | ||
B4 * | Consoante KHHA (Urdu) | kh | ख़ | 0959 | ਖ਼ | 0A59 | ||||||||||||||||
B5 | Consoante GA | g | ग | 0917 | গ | 0997 | গ | 0997 | ਗ | 0A17 | ગ | 0A97 | ଗ | 0B17 | గ | 0C17 | ಗ | 0C97 | ഗ | 0D17 | ||
B5 * | Consoante GHHA (Urdu) | ġ | ग़ | 095A | ਗ਼ | 0A5A | ||||||||||||||||
B6 | Consonant GHA | gh | घ | 0918 | ঘ | 0998 | ঘ | 0998 | ਘ | 0A18 | ઘ | 0A98 | ଘ | 0B18 | ఘ | 0C18 | ಘ | 0C98 | ഘ | 0D18 | ||
B7 | Consoante NGA | ṅ | ङ | 0919 | ঙ | 0999 | ঙ | 0999 | ਙ | 0A19 | ઙ | 0A99 | ଙ | 0B19 | ங | 0B99 | ఙ | 0C19 | ಙ | 0C99 | ങ | 0D19 |
B8 | Consoante CHA | c | च | 091A | চ | 099A | চ | 099A | ਚ | 0A1A | ચ | 0A9A | ଚ | 0B1A | ச | 0B9A | చ | 0C1A | ಚ | 0C9A | ച | 0D1A |
B9 | Consoante CHHA | CH | छ | 091B | ছ | 099B | ছ | 099B | ਛ | 0A1B | છ | 0A9B | ଛ | 0B1B | ఛ | 0C1B | ಛ | 0C9B | ഛ | 0D1B | ||
BA | Consoante JA | j | ज | 091C | জ | 099C | জ | 099C | ਜ | 0A1C | જ | 0A9C | ଜ | 0B1C | ஜ | 0B9C | జ | 0C1C | ಜ | 0C9C | ജ | 0D1C |
BA* | Consoante ZA (Urdu) | z | ज़ | 095B | ਜ਼ | 0A5B | ||||||||||||||||
BB | Consoante JHA | jh | झ | 091D | ঝ | 099D | ঝ | 099D | ਝ | 0A1D | ઝ | 0A9D | ଝ | 0B1D | ఝ | 0C1D | ಝ | 0C9D | ഝ | 0D1D | ||
AC | Consoante JNA | ñ | ञ | 091E | ঞ | 099E | ঞ | 099E | ਞ | 0A1E | ઞ | 0A9E | ଞ | 0B1E | ஞ | 0B9E | ఞ | 0C1E | ಞ | 0C9E | ഞ | 0D1E |
BD | TA difícil de consoante | ṭ | ट | 091F | ট | 099F | ট | 099F | ਟ | 0A1F | ટ | 0A9F | ଟ | 0B1F | ட | 0B9F | ట | 0C1F | ಟ | 0C9F | ട | 0D1F |
SER | Consonant Hard THA | º | ठ | 0920 | ঠ | 09A0 | ঠ | 09A0 | ਠ | 0A20 | ઠ | 0AA0 | ଠ | 0B20 | ఠ | 0C20 | ಠ | 0CA0 | ഠ | 0D20 | ||
BF | Consoante Duro DA | ḍ | ड | 0921 | ড | 09A1 | ড | 09A1 | ਡ | 0A21 | ડ | 0AA1 | ଡ | 0B21 | డ | 0C21 | ಡ | 0CA1 | ഡ | 0D21 | ||
BF * | DA | ṛ | ड़ | 095C | ড় | 09DC | ড় | 09DC | ੜ | 0A5C | ଡ଼ | 0B5C | ||||||||||
C0 | DHA Consonantal Duro | ḍh | ढ | 0922 | ঢ | 09A2 | ঢ | 09A2 | ਢ | 0A22 | ઢ | 0AA2 | ଢ | 0B22 | ఢ | 0C22 | ಢ | 0CA2 | ഢ | 0D22 | ||
C0 * | DHA com movimento consoante | ṛh | ढ़ | 095D | ঢ় | 09DD | ঢ় | 09DD | ଢ଼ | 0B5D | ||||||||||||
C1 | Consoante Difícil NA | ṇ | ण | 0923 | ণ | 09A3 | ণ | 09A3 | ਣ | 0A23 | ણ | 0AA3 | ଣ | 0B23 | ண | 0BA3 | ణ | 0C23 | ಣ | 0CA3 | ണ | 0D23 |
C2 | TA suave de consoantes | t | त | 0924 | ত | 09A4 | ত | 09A4 | ਤ | 0A24 | ત | 0AA4 | ତ | 0B24 | த | 0BA4 | త | 0C24 | ತ | 0CA4 | ത | 0D24 |
C3 | THA consoante suave | º | थ | 0925 | থ | 09A5 | থ | 09A5 | ਥ | 0A25 | થ | 0AA5 | ଥ | 0B25 | థ | 0C25 | ಥ | 0CA5 | ഥ | 0D25 | ||
C4 | Consoante suave DA | d | द | 0926 | দ | 09A6 | দ | 09A6 | ਦ | 0A26 | દ | 0AA6 | ଦ | 0B26 | ద | 0C26 | ದ | 0CA6 | ദ | 0D26 | ||
C5 | DHA Consoante Suave | dh | ध | 0927 | ধ | 09A7 | ধ | 09A7 | ਧ | 0A27 | ધ | 0AA7 | ଧ | 0B27 | ధ | 0C27 | ಧ | 0CA7 | ധ | 0D27 | ||
C6 | NA suave de consoantes | n | न | 0928 | ন | 09A8 | ন | 09A8 | ਨ | 0A28 | ન | 0AA8 | ନ | 0B28 | ந | 0BA8 | న | 0C28 | ನ | 0CA8 | ന | 0D28 |
C7 | Consoante NA (Tamil) | ṉ | ऩ | 0929 | ன | 0BA9 | ||||||||||||||||
C8 | Consoante PA | p | प | 092A | প | 09AA | প | 09AA | ਪ | 0A2A | પ | 0AAA | ପ | 0B2A | ப | 0BAA | ప | 0C2A | ಪ | 0CAA | പ | 0D2A |
C9 | PHA consoante | ph | फ | 092B | ফ | 09AB | ফ | 09AB | ਫ | 0A2B | ફ | 0AAB | ଫ | 0B2B | ఫ | 0C2B | ಫ | 0CAB | ഫ | 0D2B | ||
C9 * | Consoante FA (Urdu) | f | फ़ | 095E | ਫ਼ | 0A5E | ೞ | 0CDE | ||||||||||||||
CA | Consoante BA | b | ब | 092C | ব | 09AC | ব | 09AC | ਬ | 0A2C | બ | 0AAC | ବ | 0B2C | బ | 0C2C | ಬ | 0CAC | ബ | 0D2C | ||
CB | BHA consoante | bh | भ | 092D | ভ | 09AD | ভ | 09AD | ਭ | 0A2D | ભ | 0AAD | ଭ | 0B2D | భ | 0C2D | ಭ | 0CAD | ഭ | 0D2D | ||
CC | Consonant MA | m | म | 092E | ম | 09AE | ম | 09AE | ਮ | 0A2E | મ | 0AAE | ମ | 0B2E | ம | 0BAE | మ | 0C2E | ಮ | 0CAE | മ | 0D2E |
CD | Consoante YA | y | य | 092F | য | 09AF | য | 09AF | ਯ | 0A2F | ય | 0AAF | ଯ | 0B2F | ய | 0BAF | య | 0C2F | ಯ | 0CAF | യ | 0D2F |
CE | Consoante JYA (bengali, assamês e oriya) | ẏ | य़ | 095F | য় | 09DF | য় | 09DF | ୟ | 0B5F | ||||||||||||
CF | RA consoante | r̥ | र | 0930 | র | 09B0 | ৰ︎ | 09F0 | ਰ | 0A30 | ર | 0AB0 | ର | 0B30 | ர | 0BB0 | ర | 0C30 | ರ | 0CB0 | ര | 0D30 |
D0 | Consonant Hard RA (Southern Scripts) | ṟ | ऱ | 0931 | ற | 0BB1 | ఱ | 0C31 | ಱ | 0CB1 | റ | 0D31 | ||||||||||
D1 | Consoante LA | eu | ल | 0932 | ল | 09B2 | ল | 09B2 | ਲ | 0A32 | લ | 0AB2 | ଲ | 0B32 | ல | 0BB2 | ల | 0C32 | ಲ | 0CB2 | ല | 0D32 |
D2 | Consonant Hard LA | eu | ळ | 0933 | ਲ਼ | 0A33 | ળ | 0AB3 | ଳ | 0B33 | ள | 0BB3 | ళ | 0C33 | ಳ | 0CB3 | ള | 0D33 | ||||
D3 | ZHA consoante (Tamil e Malayalam) | eu | ऴ | 0934 | ழ | 0BB4 | ഴ | 0D34 | ||||||||||||||
D4 | VA consoante | v | व | 0935 | ব | 09AC | ৱ | 09F1 | ਵ | 0A35 | વ | 0AB5 | ଵ | 0B35 | வ | 0BB5 | వ | 0C35 | ವ | 0CB5 | വ | 0D35 |
D5 | Consoante SHA | ś | श | 0936 | শ | 09B6 | শ | 09B6 | ਸ਼ | 0A36 | શ | 0AB6 | ଶ | 0B36 | ஶ | 0BB6 | శ | 0C36 | ಶ | 0CB6 | ശ | 0D36 |
D6 | SHA Consoante Duro | ṣ | ष | 0937 | ষ | 09B7 | ষ | 09B7 | ષ | 0AB7 | ଷ | 0B37 | ஷ | 0BB7 | ష | 0C37 | ಷ | 0CB7 | ഷ | 0D37 | ||
D7 | Consoante SA | s | स | 0938 | স | 09B8 | স | 09B8 | ਸ | 0A38 | સ | 0AB8 | ସ | 0B38 | ஸ | 0BB8 | స | 0C38 | ಸ | 0CB8 | സ | 0D38 |
D8 | Consonant HA | h | ह | 0939 | হ | 09B9 | হ | 09B9 | ਹ | 0A39 | હ | 0AB9 | ହ | 0B39 | ஹ | 0BB9 | హ | 0C39 | ಹ | 0CB9 | ഹ | 0D39 |
D9 | Consoante INVISÍVEL | |||||||||||||||||||||
DA | Sinal de Vogal AA | uma | ा | 093E | া | 09BE | া | 09BE | ਾ | 0A3E | ા | 0ABE | ା | 0B3E | ா | 0BBE | ా | 0C3E | ಾ | 0CBE | ാ | 0D3E |
DB | Sinal de Vogal I | eu | ि | 093F | ি | 09BF | ি | 09BF | ਿ | 0A3F | િ | 0ABF | ି | 0B3F | ி | 0BBF | ి | 0C3F | ಿ | 0CBF | ി | 0D3F |
DB * | Sinal de vogal LI (sânscrito) | eu | ॢ | 0962 | ৢ | 09E2 | ৢ | 09E2 | ૢ | 0AE2 | ୢ | 0B62 | ౢ | 0C62 | ೢ | 0CE2 | ൢ | 0D62 | ||||
DC | Sinal de Vogal II | eu | ी | 0940 | ী | 09C0 | ী | 09C0 | ੀ | 0A40 | ી | 0AC0 | ୀ | 0B40 | ீ | 0BC0 | ీ | 0C40 | ೀ | 0CC0 | ീ | 0D40 |
DC * | Sinal de vogal LII (sânscrito) | eu | ॣ | 0963 | ৣ | 09E3 | ৣ | 09E3 | ૣ | 0AE3 | ୣ | 0B63 | ౣ | 0C63 | ೣ | 0CE3 | ൣ | 0D63 | ||||
DD | Sinal de Vogal U | você | ु | 0941 | ু | 09C1 | ু | 09C1 | ੁ | 0A41 | ુ | 0AC1 | ୁ | 0B41 | ு | 0BC1 | ు | 0C41 | ು | 0CC1 | ു | 0D41 |
DE | Sinal de Vogal UU | você | ू | 0942 | ূ | 09C2 | ূ | 09C2 | ੂ | 0A42 | ૂ | 0AC2 | ୂ | 0B42 | ூ | 0BC2 | ూ | 0C42 | ೂ | 0CC2 | ൂ | 0D42 |
DF | Sinal de Vogal RI | r̥ | ृ | 0943 | ৃ | 09C3 | ৃ | 09C3 | ૃ | 0AC3 | ୃ | 0B43 | ృ | 0C43 | ೃ | 0CC3 | ൃ | 0D43 | ||||
DF * | Sinal de vogal RII (sânscrito) | ṝ | ॄ | 0944 | ৄ | 09C4 | ৄ | 09C4 | ૄ | 0AC4 | ୄ | 0B44 | ౄ | 0C44 | ೄ | 0CC4 | ൄ | 0D44 | ||||
E0 | Sinal de vogal E (scripts do sul) | e | ॆ | 0946 | ெ | 0BC6 | ె | 0C46 | ೆ | 0CC6 | െ | 0D46 | ||||||||||
E1 | Sinal de Vogal EY | ē | े | 0947 | ে | 09C7 | ে | 09C7 | ੇ | 0A47 | ે | 0AC7 | େ | 0B47 | ே | 0BC7 | ే | 0C47 | ೇ | 0CC7 | േ | 0D47 |
E2 | Sinal de Vogal AI | ai | ै | 0948 | ৈ | 09C8 | ৈ | 09C8 | ੈ | 0A48 | ૈ | 0AC8 | ୈ | 0B48 | ை | 0BC8 | ై | 0C48 | ೈ | 0CC8 | ൈ | 0D48 |
E3 | Sinal vocálico AYE (escrita Devanágari) | ê | ॅ | 0945 | ૅ | 0AC5 | ||||||||||||||||
E4 | Sinal de vogal O (scripts do sul) | o | ॊ | 094A | ொ | 0BCA | ొ | 0C4A | ೊ | 0CCA | ൊ | 0D4A | ||||||||||
E5 | Sinal de Vogal OW | ō | ो | 094B | ো | 09CB | ো | 09CB | ੋ | 0A4B | ો | 0ACB | ୋ | 0B4B | ோ | 0BCB | ో | 0C4B | ೋ | 0CCB | ോ | 0D4B |
E6 | Sinal de Vogal AU | au | ौ | 094C | ৌ | 09CC | ৌ | 09CC | ੌ | 0A4C | ૌ | 0ACC | ୌ | 0B4C | ௌ | 0BCC | ౌ | 0C4C | ೌ | 0CCC | ൌ | 0D4C |
E7 | Sinal de Vogal AWE (Escrita Devanágari) | ô | ॉ | 0949 | ૉ | 0AC9 | ||||||||||||||||
E8 | Sinal de Omissão de Vogal (Halant) | ् | 094D | ্ | 09CD | ্ | 09CD | ੍ | 0A4D | ્ | 0ACD | ୍ | 0B4D | ் | 0BCD | ్ | 0C4D | ್ | 0CCD | ് | 0D4D | |
E9 | Sinal Diacrítico (Nuktam) | ़ | 093C | ় | 09BC | ় | 09BC | ਼ | 0A3C | ઼ | 0ABC | ଼ | 0B3C | ಼ | 0CBC | |||||||
EA | Ponto final (Viram, scripts do norte) | । | 0964 | |||||||||||||||||||
EA * | Sinal de acento vocálico AVAGRAH | ऽ | 093D | ঽ | 09BD | ঽ | 09BD | ઽ | 0ABD | ଽ | 0B3D | ఽ | 0C3D | ಽ | 0CBD | ഽ | 0D3D | |||||
EB | Não utilizado | |||||||||||||||||||||
CE | Não utilizado | |||||||||||||||||||||
ED | Não utilizado | |||||||||||||||||||||
EE | Não utilizado | |||||||||||||||||||||
EF | Código de Atributo | |||||||||||||||||||||
F0 | Código de Extensão | |||||||||||||||||||||
F1 | Dígito 0 | ० | 0966 | ০ | 09E6 | ০ | 09E6 | ੦ | 0A66 | ૦ | 0AE6 | ୦ | 0B66 | ௦ | 0BE6 | ౦ | 0C66 | ೦ | 0CE6 | ൦ | 0D66 | |
F2 | Dígito 1 | १ | 0967 | ১ | 09E7 | ১ | 09E7 | ੧ | 0A67 | ૧ | 0AE7 | ୧ | 0B67 | ௧ | 0BE7 | ౧ | 0C67 | ೧ | 0CE7 | ൧ | 0D67 | |
F3 | Dígito 2 | २ | 0968 | ২ | 09E8 | ২ | 09E8 | ੨ | 0A68 | ૨ | 0AE8 | ୨ | 0B68 | ௨ | 0BE8 | ౨ | 0C68 | ೨ | 0CE8 | ൨ | 0D68 | |
F4 | Dígito 3 | ३ | 0969 | ৩ | 09E9 | ৩ | 09E9 | ੩ | 0A69 | ૩ | 0AE9 | ୩ | 0B69 | ௩ | 0BE9 | ౩ | 0C69 | ೩ | 0CE9 | ൩ | 0D69 | |
F5 | Dígito 4 | ४ | 096A | ৪ | 09EA | ৪ | 09EA | ੪ | 0A6A | ૪ | 0AEA | ୪ | 0B6A | ௪ | 0BEA | ౪ | 0C6A | ೪ | 0CEA | ൪ | 0D6A | |
F6 | Dígito 5 | ५ | 096B | ৫ | 09EB | ৫ | 09EB | ੫ | 0A6B | ૫ | 0AEB | ୫ | 0B6B | ௫ | 0BEB | ౫ | 0C6B | ೫ | 0CEB | ൫ | 0D6B | |
F7 | Dígito 6 | ६ | 096C | ৬ | 09EC | ৬ | 09EC | ੬ | 0A6C | ૬ | 0AEC | ୬ | 0B6C | ௬ | 0BEC | ౬ | 0C6C | ೬ | 0CEC | ൬ | 0D6C | |
F8 | Dígito 7 | ७ | 096D | ৭ | 09ED | ৭ | 09ED | ੭ | 0A6D | ૭ | 0AED | ୭ | 0B6D | ௭ | 0BED | ౭ | 0C6D | ೭ | 0CED | ൭ | 0D6D | |
F9 | Dígito 8 | ८ | 096E | ৮ | 09EE | ৮ | 09EE | ੮ | 0A6E | ૮ | 0AEE | ୮ | 0B6E | ௮ | 0BEE | ౮ | 0C6E | ೮ | 0CEE | ൮ | 0D6E | |
FA | Dígito 9 | ९ | 096F | ৯ | 09EF | ৯ | 09EF | ੯ | 0A6F | ૯ | 0AEF | ୯ | 0B6F | ௯ | 0BEF | ౯ | 0C6F | ೯ | 0CEF | ൯ | 0D6F | |
FB | Não utilizado | |||||||||||||||||||||
FC | Não utilizado | |||||||||||||||||||||
FD | Não utilizado | |||||||||||||||||||||
FE | Não utilizado | |||||||||||||||||||||
FF | Não utilizado |