Alfabeto Urdu - Urdu alphabet
Alfabeto Urdu
اُردُو حُرُوفِ تَہَجِّی
urdū hurūf-e-tahajjī | |
---|---|
Tipo de script | Abjad
|
línguas | Urdu , Balti ,, Punjabi , Shina , uso infrequente em Burushaski , outros |
Scripts relacionados | |
Sistemas pais |
Proto-Sinaítico
|
Unicode | |
U + 0600 a U + 06FF U + 0750 a U + 077F |
|
Alfabeto urdu |
---|
Ç È پ Ê ٹ Ë Ì چ de cabeça Í Î Ï ڈ Ð Ñ ڑ Ò ژ Ó Ô ص Ö Ø ظ Ú Û ف Þ ک گ ل م ä ( ں ) æ ہ ( ھ ) Á ی ے |
Escrita perso-árabe estendida |
O alfabeto Urdu ( Urdu : اردو حروفِ تہجی , romanizado : urdū harūf-e-tahajjī ), é o alfabeto da direita para a esquerda usado para o Urdu . É uma modificação do alfabeto persa , que por sua vez é um derivado do alfabeto árabe . O alfabeto Urdu tem até 39 ou 40 letras distintas sem letras maiúsculas e minúsculas distintas e é normalmente escrito na escrita caligráfica Nastaʿlīq , enquanto o árabe é mais comumente escrito no estilo Naskh .
Normalmente, as transliterações simples do urdu para o alfabeto latino (chamado urdu romano ) omitem muitos elementos fonêmicos que não têm equivalente em inglês ou em outras línguas comumente escritas na escrita latina .
História
A escrita Urdu padrão é uma versão modificada da escrita Perso-Árabe e tem suas origens no Irã do século XIII . Está intimamente relacionado ao desenvolvimento do estilo nasta'liq da escrita perso-árabe.
Apesar da invenção da máquina de escrever urdu em 1911, os jornais urdu continuaram a publicar impressões de escritas manuscritas por calígrafos conhecidos como katibs ou khush-navees até o final dos anos 1980. O jornal nacional paquistanês Daily Jang foi o primeiro jornal urdu a usar a composição do Nastaʿlīq baseada em computador. Há esforços em andamento para desenvolver um suporte mais sofisticado e fácil de usar para o Urdu em computadores e na Internet . Hoje em dia, quase todos os jornais, revistas, periódicos e periódicos em urdu são compostos em computadores com programas de software em urdu.
Além do subcontinente indiano , a escrita urdu também é usada pela grande diáspora do Paquistão , incluindo no Reino Unido , Emirados Árabes Unidos , Estados Unidos , Canadá , Arábia Saudita e outros lugares.
Nastaliq
Urdu está escrito na Nastaliq estilo ( persa : نستعلیق nasta'liq). O Nastaliq estilo de escrita caligráfica começou como um persa mistura dos Naskh e Ta'liq scripts. Após a conquista Mughal , Nasta'liq se tornou o estilo de escrita preferido para o urdu. É o estilo dominante no Paquistão e muitos escritores urdu em outras partes do mundo o utilizam. Nastaʿlīq é mais cursivo e fluente do que sua contraparte Naskh .
No alfabeto árabe , e em muitos outros derivados dele, as letras são consideradas como tendo duas ou três formas gerais cada, com base em sua posição na palavra (embora a caligrafia árabe possa adicionar uma grande complexidade). Mas o estilo Nastaliq no qual o urdu é escrito usa mais de três formas gerais para muitas letras, mesmo em documentos simples não decorativos.
Alfabeto
A escrita Urdu é uma escrita abjad derivada da escrita persa moderna , que por sua vez é um derivado da escrita árabe . Como um abjad, a escrita Urdu mostra apenas consoantes e vogais longas; vogais curtas só podem ser inferidas pela relação das consoantes umas com as outras. Embora esse tipo de escrita seja conveniente em línguas semíticas como o árabe e o hebraico , cujas raízes consonantais são a chave da frase, o urdu é uma língua indo-européia , que requer mais precisão na pronúncia do som das vogais, portanto, necessitando de mais memorização. O número de letras do alfabeto urdu é um tanto ambíguo e debatido.
Nomes de letras e fonemas
Carta | Nome | IPA | Romanização | Som: descrição ou som em inglês. | Unicode | Pedido | ||||
---|---|---|---|---|---|---|---|---|---|---|
urdu | Urdu romano | ALA-LC |
Caçador | |||||||
ا | الف | Alif | / ɑː /, / ʔ /, / ∅ / | ā , - | ā , - | a como em b a th ( inglês do Reino Unido , pronúncia recebida ) | U + 0627 | 1 | 1 | 1 |
ب | بے | ser | / b / | b | b | b como em Ball. | U + 0628 | 2 | 2 | 2 |
پ | پے | educaçao Fisica | / p / | p | p | p como em Pigeon. | U + 067E | 3 | 3 | 3 |
ت | تے | tē | / t / | t | t | Dental T (usado em espanhol e holandês / flamengo) | U + 062A | 4 | 4 | 4 |
ٹ | ٹے | ṭē | / ʈ / | ṭ | t | T como em ka rt a (sueco) | U + 0679 | 5 | 5 | 5 |
ث | ثے | s̱ē | / s / | s̱ | s | c como no cinema. | U + 062B | 6 | 6 | 6 |
ج | جيم | jim | / d͡ʒ / | j | j | j em J ug. | U + 062C | 7 | 7 | 7 |
چ | چے | cē | / t͡ʃ / | c | CH | ch em Ch imney. | U + 0686 | 8 | 8 | 8 |
ح | بڑی حے | baṛī ḥē | / ɦ / | ḥ | h | h como em Happy. | U + 062D | 9 | 9 | 9 |
ہٹی حے | hutti ḥē | |||||||||
خ | خے | k͟hē | / x / | k͟h | kh | Sem equivalente completo em inglês. Semelhante ao kh gutural em Khundak. | U + 062E | 10 | 10 | 10 |
د | دال | dāl | / d / | d | d | Dental D (usado em espanhol e holandês / flamengo) | U + 062F | 11 | 11 | 11 |
ڈ | ڈال | ḍāl | / ɖ / | ḍ | d | D como em gå rd ag (sueco) | U + 0688 | 12 | 12 | 12 |
ذ | ذال | ẕāl | / z / | ẕ | z | Z como em zebra. | U + 0630 | 13 | 13 | 13 |
ر | رے | ré | / r / | r | r | r como em Razor. | U + 0631 | 14 | 14 | 14 |
ڑ | ڑے | ré |
/ ɽ / |
ṛ | r | Sem equivalente completo em inglês. Semelhante ao hard dh em Raigadh. | U + 0691 | 15 | 15 | 15 |
ز | زے | Z e | / z / | z | z | z como em Zebra. | U + 0632 | 16 | 16 | 16 |
ژ | ژے | zhē |
/ ʒ / |
zh | zh | si como na versão. | U + 0698 | 17 | 17 | 17 |
س | سین | pecado | / s / | s | s | s como no mar. | U + 0633 | 18 | 18 | 18 |
Ô | شین | canela | / ʃ / | sh | sh | sh como em brilho. | U + 0634 | 19 | 19 | 19 |
ص | صاد | ṣwād | / s / | ṣ | s | s como em juro. | U + 0635 | 20 | 20 | 20 |
ض | ضاد | ẓwād | / z / | ẓ | z | z como na gazeta. | U + 0636 | 21 | 21 | 21 |
ط | طوے | dedo do pé | / t / | t̤ | t | Sem equivalente completo em inglês. Semelhante a ta como em Talia. | U + 0637 | 22 | 22 | 22 |
ظ | ظوے | z̤oʼē | / z / | z̤ | z | Hard z no zoológico. | U + 0638 | 23 | 23 | 23 |
ع | عین | ʻAin |
/ ɑː /, / oː /, / eː /, / ʔ /, / ʕ /, / ∅ / |
` | ` |
Sem equivalente completo em inglês. Semelhante ao áspero gutural a na maçã. | U + 0639 | 24 | 24 | 24 |
غ | غین | g͟hain | / ɣ / | g͟h | gh | Sem equivalente completo em inglês. Semelhante ao gh gutural em Ghalib. | U + 063A | 25 | 25 | 25 |
ف | فے | fē | / f / | f | f | f como em flor. | U + 0641 | 26 | 26 | 26 |
ق | قاف | qāf | / q / | q | q | Não é usado em inglês. Em árabe, é a primeira carta do Qatar e a última do Iraque . Às vezes é dito que se assemelha ao chamado de um corvo. | U + 0642 | 27 | 27 | 27 |
ک | کاف | kāf | / k / | k | k | k como em Kite. | U + 06A9 | 28 | 28 | 28 |
گ | گاف | gāf | / ɡ / | g | g | g como na grama. | U + 06AF | 29 | 29 | 29 |
ل | لام | eu | /eu/ | eu | eu | l como em limão. | U + 0644 | 30 | 30 | 30 |
م | میم | mim | / m / | m | m | m como em Mike. | U + 0645 | 31 | 31 | 31 |
ن | نون | freira |
/ n /, / ɲ /, / ɳ /, / ŋ / |
n | n | n como ao meio-dia. | U + 0646 | 32 | 32 | 32 |
ں |
نون غنّہ | nūn g͟hunnā |
/ ◌̃ / |
ṉ | n | Vogal nasal. Não é usado em inglês, mas é usado em francês. |
U + 06BA U + 0658 |
32a | 33 | |
و | واؤ | wāʼo |
/ ʋ /, / u ː /, / ʊ /, / o ː /, / ɔː / |
v , ū , u , o , au |
w , ¾ , u , o , au |
w como no walet. | U + 0648 | 33 | 33 | 34 |
ہ | گول ہے | gōl hē | / ɦ /, / ɑː /, / eː / | h , ā , e | h , ā , e | h como em quente. |
U + 06C1 |
34 | 34 | 35 |
چھوٹی ہے | choṭī hē | 34a | ||||||||
ھ | دو چشمی ہے | do-cashmī hē |
/ ʰ / ou / ʱ / |
h | h | h como na cabeça | U + 06BE | 35 | 34b | 36 |
ی | چھوٹی یے | choṭī yē | / j /, / iː /, / ɑː / | y , ī , á | y , ī , á | y como em amarelo ou ee como em tato. | U + 06CC | 36 | 35 | 38 |
ے | بڑی یے | baṛī yē |
/ ɛː /, / eː / |
ai , e | ai , e | a como em gato ou ay como em dia. | U + 06D2 | 37 | 35b | 39 |
ئ | ہمزہ | Hamzah |
/ ʔ / ou / ∅ / |
ʼ, -, yi | ʼ, -, yi | Som Ya (por exemplo, yak) para primeiro. Ai (som Sloppy A) por segundo. | U + 0626 | 35a | 37 |
|
ء | U + 0621 | 0 |
- Notas de rodapé:
Personagens e variações adicionais
Tāʼ marbūṭah árabe
Tāʼ marbūṭah também é às vezes considerada a 40ª letra do alfabeto urdu, embora seja raramente usada, exceto em algumas palavras emprestadas do árabe. Tāʼ marbūṭah é considerado uma forma de tā, a versão árabe do urdu tē, mas não é pronunciado como tal e, quando substituído por uma letra urdu em palavras emprestadas naturalizadas, geralmente é substituído por Gol hē.
Mesa
Grupo | Carta | Nome (ver: Glossário de palavras-chave ) | Unicode | |||
---|---|---|---|---|---|---|
Nastaliq |
Naskh com diacríticos |
Urdu romano ou inglês | ||||
Alif | آ | آ | الف مدہ |
الِف مَدّه |
alif maddah |
U + 0622 alef com madda acima |
Hamza | ء | ء | ہمزہ |
ہَمْزه |
Hamzah | U + 0621 hamza |
___ | ___ | Hamza na linha | ||||
ٔ | ــٔـ | ___ | ___ |
diacrítico de Hamza |
U + 0654 Hamza Acima |
|
ئ | ئ | ہمزہ |
ہَمْزه |
Hamzah | U + 0626 yeh com hamza acima |
|
___ | ___ | yē hamza / alif hamza | ||||
ۓ | ۓ | ___ | ___ | baṛī yē hamza | U + 06D3 yeh barree com hamza acima |
|
ؤ | ؤ | واوِ مَہْمُوز |
واوِ مَہْمُوز |
vāv-e mahmūz |
U + 0624 waw com hamza acima |
|
ۂ ۂ | ۂ ـۂ | ___ | ___ | U + 06C2 heh gol com hamza acima ou U + 06C1 + U + 0654 |
||
árabe | ۃ ۃ | ۃ ـۃ |
Árabe : تاء
مربوطة |
Árabe : تاء
مربوطة |
tāʼ marbūṭah "ta ligado" |
U + 06C3 o gol de marbuta |
ة ة | ة ـة | U + 0629 teh marbuta |
||||
ت | ت |
Árabe : تاء
مفتوحة |
Árabe : تاء
مفتوحة |
tāʼ maftūḥah "ta aberto" |
U + 062A Teh |
- Notas de rodapé:
Hamza em Nastaliq
Hamza pode ser difícil de reconhecer na caligrafia urdu e nas fontes projetadas para replicá-la, parecendo-se muito com os dois pontos acima, conforme apresentado em ت Té e ق Qaf, enquanto nas fontes árabes e geométricas é mais distinto e se assemelha muito à forma ocidental do numeral 2 (dois).
Digraphs
قتر
Não. | Dígrafo | Transcrição | IPA | Exemplo |
1 | بھ | bh | [bʱ] | بھاری |
2 | پھ | ph | [pʰ] | پھول |
3 | تھ | º | [tʰ] | تھم |
4 | ٹھ | º | [ʈʰ] | ٹھنڈا |
5 | جھ | jh | [d͡ʒʱ] | جھاڑی |
6 | چھ | CH | [t͡ʃʰ] | چھتری |
7 | دھ | dh | [dʱ] | دھوبی |
8 | ڈھ | ḍh | [ɖʱ] | ڈھول |
9 | رھ | rh | [rʱ] | تیرھواں |
10 | ڑھ | ṛh | [ɽʱ] | اڑھائی |
11 | کھ | kh | [kʰ] | کھانسی |
12 | گھ | gh | [ɡʱ] | گھوڑا |
13 | لھ | lh | [eu] | دولھا (alternativa de دُلہا |
14 | مھ | mh | [mʱ] | تمھیں (alternativa de تمہیں ) |
15 | نھ | nh | [nʱ] | ننھا (embora indiscutivelmente apenas um encontro consonantal) |
16 | وھ | wh | [ʋʱ] | وھاب (embora indiscutivelmente apenas um encontro consonantal) |
17 | یھ | sim | [jʱ] |
Diferenças do alfabeto persa
O urdu tem mais letras adicionadas à base persa para representar sons não presentes no persa, que já tem letras adicionais adicionadas à própria base árabe para representar sons não presentes no árabe. As letras adicionadas incluem: ٹ para representar / ʈ / , ڈ para representar / ɖ / , ڑ para representar / ɽ / , ں para representar / ◌̃ / e ے para representar / ɛ: / ou / e: / . A do-chashmi- separada ele carta, ھ , existe para denotar um / ʰ / ou um / ʱ / . Esta carta é usada principalmente como parte da multidão de dígrafos, detalhados abaixo.
Letras Retroflex
O hindustani antigo usava quatro pontos ٿ ڐ ڙ sobre três letras árabes ت د ر para representar consoantes retroflexas. Na escrita, esses pontos eram freqüentemente escritos como uma pequena linha vertical ligada a um pequeno triângulo. Posteriormente, esta forma tornou-se idêntica a uma pequena carta ط t̤o'ē . É comum e erroneamente assumido que o próprio ṭāʾ era usado para indicar consoantes retroflexas por ser uma consoante alveolar enfática que os escribas árabes pensavam se aproximar dos retroflexos hindustânios. Em Urdu moderno ط , chamado to'e é sempre pronunciado como dental , não um retroflex .
Vogais
A língua Urdu tem 10 vogais e 10 vogais nasalizadas. Cada vogal possui quatro formas dependendo de sua posição: inicial, intermediária, final e isolada. Como em seu alfabeto árabe pai , as vogais urdu são representadas usando uma combinação de dígrafos e diacríticos. Alif , Waw , Ye , He e suas variantes são usados para representar vogais.
Gráfico vocálico
Urdu não tem letras vocálicas independentes. As vogais curtas ( a , i , u ) são representadas por diacríticos opcionais ( zabar , zer , pesh ) na consoante precedente ou em uma consoante substituta ( alif , ain ou hamzah ) se a sílaba começar com a vogal, e as vogais longas por consoantes alif , ain , ye e wa'o as matres lectionis, com diacríticos não ambíguos , alguns dos quais são opcionais ( zabar , zer , pesh ), enquanto outros não ( madd , hamzah ). O urdu não possui vogais curtas no final das palavras. Esta é uma tabela de vogais Urdu:
Romanização | Pronúncia | Final | Meio | Inicial |
---|---|---|---|---|
uma | / ə / | N / D | ـَ | اَ |
uma | /uma/ | ـَا ، ـَی ، ـَہ | ـَا | آ |
eu | / ɪ / | N / D | ـِ | اِ |
eu | /eu/ | ـِى | ـِیـ | اِی |
e | / eː / | ـے | ـیـ | اے |
ai | / ɛː / | ـَے | ـَیـ | اَے |
você | / ʊ / | N / D | ـُ | اُ |
você | /você/ | ـُو | اُو | |
o | / oː / | ـو | او | |
au | / ɔː / | ـَو | اَو |
Alif
Alif é a primeira letra do alfabeto Urdu e é usada exclusivamente como vogal. No início de uma palavra, alif pode ser usado para representar qualquer uma das vogais curtas: اب ab , اسم ism , اردو Urdū . Por longo, ā no início das palavras alif-mad é usado: آپ āp , mas um alif simples no meio e no final: بھاگنا bhāgnā .
Wāʾo
Wāʾo é usado para renderizar as vogais "ū", "o", "u" e "au" ([uː], [oː], [ʊ] e [ɔː] respectivamente), e também é usado para renderizar o labiodental aproximant , [ʋ]. Somente quando precedido pela consoante Khe ( خ ), pode wā'o tornar o som de "u" ([ʊ]) (como em خود , " Khud " - me ), ou não pronunciado em tudo (como no خواب , " k͟haab "- sonho ).
vós
Ye é dividido em duas variantes: choṭī ye ("little ye") e baṛī ye ("big ye").
Choṭī ye ( ی ) é escrito em todas as formas exatamente como em persa. É usado para a vogal longa "ī" e a consoante "y".
Baṛī ye ( ے ) é usado para traduzir as vogais "e" e "ai" ( / eː / e / ɛː / respectivamente). Baṛī ye é distinguível por escrito de choṭī ye apenas quando vem no final de uma palavra / ligadura. Além disso, Baṛī ye nunca é usado para iniciar uma palavra / ligadura, ao contrário de choṭī ye .
Nome da letra | Formulário Final | Forma intermediária | Formulário Inicial | Forma Isolada |
---|---|---|---|---|
چھوٹی يے Choṭī ye |
ـی | ـیـ | یـ | ی |
بڑی يے Baṛī ye |
ـے | ے |
Os 2 ele é
Ele é dividido em duas variantes: gol he ("redondo ele") e do-cašmi he (" ele com dois olhos").
Gol he ( ہ ) é escrito redondo e em zigue-zague e pode transmitir o som "h" ( / ɦ / ) em qualquer lugar em uma palavra. Além disso, no final de uma palavra, pode ser usado para renderizar as vogais "a" ou "e" longas ( / ɑː / ou / eː / ), o que também altera ligeiramente a sua forma (é importante notar que no moderno sistemas de escrita digital, esta forma final é alcançada escrevendo dois ( ele consecutivamente).
Do-cašmi he ( ھ ) é escrito como no estilo Naskh árabe (como um loop), a fim de criar as consoantes aspiradas e escrever palavras árabes.
Nome da letra | Formulário Final | Forma intermediária | Formulário Inicial | Forma Isolada |
---|---|---|---|---|
گول ہے Gol ele |
ـہ | ـہـ | ہـ | ہ |
دو چشمی ہے Do-cašmi he |
ـھ | ـھـ | ھـ | ھ |
Ayn
Ayn em sua posição inicial e final é silenciosa na pronúncia e é substituída pelo som de sua vogal precedente ou seguinte.
Nun Ghunnah
A nasalização vocálica é representada por nun ghunna escrito após suas versões não nasalizadas, por exemplo: ہَے quando nasalizado se tornaria ہَیں . Na forma intermediária, nun ghunna é escrito como nun e é diferenciado por um diacrítico chamado maghnoona ou ulta jazm, que é um símbolo V sobrescrito acima do ن٘ .
Exemplos:
Forma | urdu | Transcrição |
Ortografia | ں | ṉ |
Formulário final | میں | a Principal |
Forma intermediária | کن٘ول | Kaṉwal |
Diacríticos
Urdu usa o mesmo subconjunto de diacríticos usados em árabe com base nas convenções persas. Urdu também usa nomes persas dos diacríticos em vez de nomes árabes. Os diacríticos comumente usados são zabar (árabe fatḥah ), zer (árabe kasrah ), pesh (árabe dammah ) que são usados para esclarecer a pronúncia das vogais, como mostrado acima. Jazam ( , árabe sukun ) é usado para indicar um encontro consonantal e tashdid ( , árabe shaddah ) é usado para indicar uma geminação , embora nunca é usado para verbos, que exigem consoantes duplas para ser explicitada separadamente. Outros diacríticos incluem khari zabar ( adaga árabe alif ), do zabar ( fathatan árabe ), que são encontrados em algumas palavras emprestadas do árabe comuns . Outros diacríticos árabes também são às vezes usados, embora muito raramente em palavras emprestadas do árabe . Zer-e-izafat e hamzah-e-izafat são descritos na próxima seção.
Além dos diacríticos comuns, o urdu também tem diacríticos especiais, que muitas vezes são encontrados apenas em dicionários para esclarecimento de pronúncia irregular. Esses diacríticos incluem kasrah-e-majhool , fathah-e-majhool , dammah-e-majhool , maghnoona , ulta jazam , alif-e-wavi e alguns outros diacríticos muito raros. Entre estes, apenas maghnoona é comumente usado em dicionários e tem uma representação Unicode em U + 0658. Outros diacríticos raramente são escritos na forma impressa, principalmente em alguns dicionários avançados.
Iẓāfat
Iẓāfat é uma construção sintática de dois substantivos, onde o primeiro componente é um determinado substantivo e o segundo é um determinante. Esta construção foi emprestada do persa. Uma vogal curta "i" é usada para conectar essas duas palavras e, ao pronunciar a palavra recém-formada, a vogal curta é conectada à primeira palavra. Se as primeiras extremidades de palavras em uma consoante ou um 'Ain ( ع ), pode ser escrita como zer ( ) no final da primeira palavra, mas geralmente não é escrito em tudo. Se as primeiras extremidades da palavra na Choti ele ( ہ ) ou ye ( ی ou ے ), então Hamza ( ء ) é usado acima da última carta ( ۂ ou ئ ou ۓ ). Se as primeiras extremidades de palavras em uma vogal longa ( ا ou و ), em seguida, uma variação das vos Bari ( ے ) com Hamza no topo ( ئے , obtido por adição de ے para ئ ) é adicionado no fim da primeira palavra.
Formulários | Exemplo | Transliteração | Significado |
---|---|---|---|
ــِ | شیرِ پنجاب | sher -e Panjāb | o leão do Punjab |
ۂ | ملکۂ دنیا | malikā- ye dunyā | a rainha do mundo |
ئ | ولئ کامل | walī -ye kāmil | santo perfeito |
ۓ | مۓ عشق | Mai- ye ishq | o vinho do amor |
ئے | روئے زمین | rū -ye zamīn | a superfície da Terra |
صدائے بلند | sadā -ye buland | uma voz alta |
Computadores e o alfabeto Urdu
Nos primeiros dias dos computadores, o urdu não era representado adequadamente em nenhuma página de código . Uma das primeiras páginas de código a representar o Urdu foi a IBM Code Page 868, que data de 1990. Outras páginas de código antigas que representavam os alfabetos Urdu eram a codificação Windows-1256 e MacArabic, ambas datadas de meados dos anos 1990. Em Unicode , o Urdu é representado dentro do bloco árabe. Outra página de código para Urdu, que é usada na Índia, é o código de script perso-árabe para intercâmbio de informações . No Paquistão, a página de código de 8 bits desenvolvida pela Autoridade de Língua Nacional é chamada Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT), que representa o Urdu em sua forma mais completa, incluindo alguns de seus diacríticos especializados, embora UZT não seja projetado para coexistem com o alfabeto latino.
Codificando Urdu em Unicode
Personagens em Urdu |
Caracteres em árabe |
---|---|
ہ (U + 06C1) ھ (U + 06BE) |
ه (U + 0647) |
ی (U + 06CC) |
ى (U + 0649) ي (U + 064A) |
ک (U + 06A9) | ك (U + 0643) |
Como outros sistemas de escrita derivados da escrita árabe, o Urdu usa a faixa Unicode 0600–06FF. Certos glifos neste intervalo parecem visualmente semelhantes (ou idênticos quando apresentados com fontes específicas), embora a codificação subjacente seja diferente. Isso apresenta problemas para armazenamento e recuperação de informações. Por exemplo, a cópia eletrônica da Universidade de Chicago de "Um Dicionário, Hindustani e Inglês" de John Shakespear inclui a palavra ' بهارت ' ( bhārat "Índia"). A pesquisa da string " بھارت " não retorna resultados, enquanto a consulta com a string (de aparência idêntica em muitas fontes) " بهارت " retorna a entrada correta. Isso ocorre porque a forma medial da letra urdu do chashmi he (U + 06BE) - usada para formar dígrafos aspirados em urdu - é visualmente idêntica em sua forma medial à letra árabe hāʾ (U + 0647; valor fonético / h / ) . Em Urdu, o fonema / h / é representado pelo caractere U + 06C1, denominado gol he (redondo he ), ou chhoti he (pequeno he ).
Em 2003, o Centro de Pesquisa em Processamento de Linguagem Urdu (CRULP) - uma organização de pesquisa afiliada à Universidade Nacional de Computação e Ciências Emergentes do Paquistão - produziu uma proposta para mapear a codificação UZT de 1 byte de caracteres Urdu para o padrão Unicode. Esta proposta sugere um glifo Unicode preferido para cada caractere do alfabeto Urdu.
Programas
O Daily Jang foi o primeiro jornal urdu a ser composto digitalmente em Nasta'liq por computador. Há esforços em andamento para desenvolver um suporte mais sofisticado e fácil de usar para o Urdu em computadores e na Internet. Hoje em dia, quase todos os jornais, revistas, jornais e periódicos em Urdu são compostos em computadores por meio de vários programas de software em Urdu, sendo o mais difundido o pacote InPage Desktop Publishing. A Microsoft incluiu suporte ao idioma Urdu em todas as novas versões do Windows e tanto o Windows Vista quanto o Microsoft Office 2007 estão disponíveis em Urdu por meio do suporte ao Language Interface Pack . A maioria das distribuições do Linux Desktop permite a fácil instalação de suporte e traduções para Urdu também. A Apple implementou o teclado do idioma Urdu em dispositivos móveis em sua atualização iOS 8 em setembro de 2014.
Padrões e sistemas de romanização
Existem vários padrões de romanização para escrever urdu com o alfabeto latino, embora eles não sejam muito populares porque a maioria não consegue representar o idioma urdu adequadamente. Em vez de esquemas de romanização padrão, as pessoas na Internet, telefones celulares e mídia geralmente usam uma forma não padrão de romanização que tenta imitar a ortografia do inglês . O problema desse tipo de romanização é que ele só pode ser lido por falantes nativos, e mesmo para eles com grande dificuldade. Entre os esquemas de romanização padronizados, o mais preciso é a romanização ALA-LC , que também é apoiada pela National Language Authority . Outros esquemas de romanização são frequentemente rejeitados porque não são capazes de representar sons em Urdu de maneira adequada ou porque geralmente não levam em consideração a ortografia do urdu e favorecem a pronúncia em vez da ortografia.
A Autoridade de Língua Nacional do Paquistão desenvolveu vários sistemas com notações específicas para significar sons que não sejam do inglês, mas eles só podem ser lidos adequadamente por alguém que já esteja familiarizado com as cartas de empréstimo.
Roman Urdu também tem significado entre os cristãos do Paquistão e do norte da Índia . Urdu era a língua nativa dominante entre os cristãos de Karachi e Lahore no atual Paquistão e Madhya Pradesh , Uttar Pradesh Rajasthan na Índia, durante a primeira parte dos séculos 19 e 20, e ainda é usado pelos cristãos nesses lugares. Os cristãos paquistaneses e indianos costumavam usar a escrita romana para escrever o urdu. Assim, o urdu romano era uma forma comum de escrita entre os cristãos paquistaneses e indianos nessas áreas até a década de 1960. A Sociedade Bíblica da Índia publica Bíblias romanas Urdū que foram vendidas no final da década de 1960 (embora ainda sejam publicadas hoje). Os cancioneiros da igreja também são comuns em urdu romano. No entanto, o uso do urdu romano está diminuindo com o uso mais amplo do hindi e do inglês nesses estados.
Apêndices
Glossário de palavras-chave de nomes de letras
Nome (s) da letra | Urdu Word | Exemplos de outros usos | |||||||
---|---|---|---|---|---|---|---|---|---|
Forma isolada |
Nome urdu |
Urdu romano | urdu | IPA |
Nome urdu romano |
Tradução do inglês | urdu | Roman Urdu ou IPA | Tradução |
ح | بَڑی حے | baṛī ħē | بَڑی | bəɽi | baṛī / bari |
grande / ancião | بڑی آنت | Formiga Baṛi | intestino grosso |
ے | بَڑی يـے | baṛī yē | آنت | Formiga | intestino | ||||
ی | چھوٹی یے | čhōṭī yē | چھوٹی | tʃʰoːʈi | choti | pequeno / menor / júnior | |||
ہ | چھوٹی ہے | čhōṭī hē | چھوٹی آنت | intestino delgado | |||||
گول ہـے | gōl hē | گول | goːl | gōl | redondo / esférico / vago / bobo / obeso | گول گپے | gol gappay | Panipuri | |
ھ | دوچَشْمی ہے | dō-čašmī hē | دوچَشْمی | do-cashmī | dois olhos |
دو چشمی دوربین |
do-cashmi
dorabīn |
binóculos | |
دوربین | dorabīn | telescópio | |||||||
دو | Faz | 2 / dois | دو ایوانیت | faça ayvanīt | bicameralismo | ||||
چشم | / tʃəʃm / | chashm | o olho / esperança / expectativa | چشم | caxemira | olho | |||
ں | نُونِ غُنّہ | nūn-e ğunnah | غُنّہ | ɣʊnnɑ | ğunnah / g͟hunnah | som nasal ou sotaque | |||
آ | الِف مَدّه | alif maddah | مَدّه | maddah | Árabe : | ||||
ؤ | واوِ مَہْمُوز | vāv-e mahmūz | مَہْمُوز | mæhmuːz | Mahmūz | defeituoso / impróprio | |||
ء ا آ ب پ ت ٹ ث ب ج چ خ ح د ڈ ذ ر ر ز ز ژ س ش ص ض ط ظ ع غ ف ق ک گ ل م ن ں و ہ ھ ی ے |
حروف تہجی |
harūf tahajī ( alfabeto ) | تہجی | tahajī | seqüência |
||||
حُرُوف | / hʊruːf / | Harūf | letras (plural) (frequentemente chamadas de "alfabetos" no inglês informal do Paquistão) |
||||||
حَرْف | / hərf / | Harf | "letra do alfabeto" / caligrafia / declaração / culpa / estigma |
Veja também
- Escrita nastaʻliq
- Alfabeto persa
- Romanização do Urdu
- Urdu Braille
- Urdu Informática
- Teclado urdu
- Urdu Wikipedia
Referências
Fontes
- Delacy, Richard (2003). Script de Urdu para iniciantes . McGraw-Hill.
- Delacy, Richard (2010). Leia e escreva o script Urdu . McGraw-Hill. ISBN 9780071747462.
- "Romanização do Urdu" (PDF) . A Biblioteca do Congresso.
- Ishida, Richard. "Notas de script Urdu" .