Subscritos e sobrescritos Unicode - Unicode subscripts and superscripts

A diferença entre sobrescrito / subscrito e glifos de numerador / denominador. Em muitas fontes populares, os caracteres Unicode "sobrescrito" e "subscrito" são, na verdade, glifos de numerador e denominador.

O Unicode tem versões subscritas e sobrescritas de vários caracteres, incluindo um conjunto completo de algarismos arábicos . Esses caracteres permitem que qualquer equação polinomial , química e outras equações sejam representadas em texto simples, sem usar qualquer forma de marcação como HTML ou TeX .

O World Wide Web Consortium e o Unicode Consortium fizeram recomendações sobre a escolha entre usar marcação e usar caracteres sobrescritos e subscritos:

Quando usado em contexto matemático ( MathML ), é recomendado o uso consistente de marcação de estilo para sobrescritos e subscritos .... No entanto, quando super e subscritos devem refletir distinções semânticas, é mais fácil trabalhar com esses significados codificados no texto. do que a marcação, por exemplo, na transcrição fonética ou fonêmica .

Usos

O uso pretendido quando esses caracteres foram adicionados ao Unicode era permitir que fórmulas químicas e álgebraicas e fonéticas fossem escritas sem marcação, mas produzissem sobrescritos e subscritos verdadeiros. Assim, "H₂O" (usando um caractere subscrito) é suposto ser idêntico a "H 2 O" (com marcação subscrito).

Na realidade, a maioria das fontes que incluem esses caracteres ignoram a definição Unicode e projetam os dígitos para os glifos matemáticos do numerador e do denominador , que são menores do que os caracteres normais, mas estão alinhados com a linha final e a linha de base , respectivamente. Quando usados ​​com o solidus , esses glifos são úteis para fazer frações diagonais arbitrárias (semelhantes ao ½ glifo). Fazendo frações usando software existente de super / subscritos exige muitos personagens e não se parece com a fração prestados (exemplo: 1 / 2 ), os designers de modo fonte desde que esta alternativa. Isso também torna as letras sobrescritas úteis para indicadores ordinais , correspondendo melhor aos caracteres ª e º. No entanto, isso os torna incorretos para super e subscritos normais, e as fórmulas são renderizadas corretamente usando marcação em vez desses caracteres.

O Unicode pretendia produzir frações diagonais por meio de um mecanismo diferente, mas é muito mal suportado. A barra de fração U + 2044 é visualmente semelhante ao solidus, mas quando usada com os dígitos comuns (não os sobrescritos e subscritos) tem como objetivo informar a um sistema de layout que uma fração como ¾ deve ser renderizada usando a substituição automática de glifos para os dígitos . Alguns navegadores suportam isso, mas não em todas as fontes. Uma seleção de fontes é mostrada na tabela abaixo.

Comparação de codificações de frações simples
Personagens Fonte Resultado
U + 00BD ½ FRAÇÃO VULGAR METADE Predefinição ½
U + 00B9 ¹ SUPERSCRIPT ONE , U + 002F / SOLIDUS , U + 2082 ASSINATURA DOIS ¹ / ₂
U + 00B9 ¹ SUPERSCRIPT ONE , U + 2044 FRACTION SLASH , U + 2082 ASSINATURA DOIS ¹⁄₂
U + 0031 1 DÍGITO UM ,
U + 2044 CORTE DE FRAÇÃO ,
U + 0032 2 DÍGITO DOIS
1⁄2
Arial 1⁄2
Cambria 1⁄2
Consolas 1⁄2
Times New Roman 1⁄2
FiraGO 1⁄2
EB Garamond 1⁄2
Cantarell 1⁄2
Lato 1⁄2
Linux Libertine O 1⁄2
Nimbus Roman 1⁄2
Ubuntu 1⁄2
Yrsa 1⁄2

Bloco de sobrescritos e subscritos

Os dígitos sobrescritos mais comuns (1, 2 e 3) estavam no ISO-8859-1 e, portanto, foram transportados para as posições na faixa Latin-1 do Unicode. O resto foi colocado em uma seção dedicada do Unicode em U + 2070 a U + 209F. As duas tabelas abaixo mostram esses personagens. Cada caractere sobrescrito ou subscrito é precedido por um x normal para mostrar o subscrito / sobrescrito. A tabela à esquerda contém os caracteres Unicode reais; o da direita contém os equivalentes usando marcação HTML para o subscrito ou sobrescrito.

Caracteres Unicode
0 1 2 3 4 5 6 7 8 9 UMA B C D E F
U + 00Bx
U + 207x x⁰ xⁱ x⁴ x⁵ x⁶ x⁷ x⁸ x⁹ x⁺ x⁻ x⁼ x⁽ x⁾ xⁿ
U + 208x x₀ x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈ x₉ x₊ x₋ x₌ x₍ x₎
U + 209x xₐ xₑ xₒ xₓ xₔ xₕ xₖ xₗ xₘ xₙ xₚ xₛ xₜ
Simulado usando tags <sup>ou<sub>
0 1 2 3 4 5 6 7 8 9 UMA B C D E F
U + 00Bx x 2 x 3 x 1
U + 207x x 0 x i x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x ) x n
U + 208x x 0 x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x + x - x = x ( x )
U + 209x x a x e x o x x x ə x h x k x l x m x n x p x s x t
  Reservado para uso futuro.
  Outros caracteres de Latin-1 não relacionados a super- ou subscripts.

Outros caracteres sobrescritos e subscritos

O Unicode versão 13.0 também inclui caracteres subscritos e sobrescritos destinados ao uso semântico, nos seguintes blocos:

Sobrescrito
  • O bloco do Suplemento Latim-1 contém os indicadores ordinais feminino e masculino ª e º.
  • O bloco latino Extended-C contém um sobrescrito adicional, ⱽ.
  • O bloco Latim Extended-D contém cinco sobrescritos: ꝰ ꟸ ꟹ ꟲ ꟳ.
  • O bloco latino Extended-E contém cinco sobrescritos: ꭜ ꭝ ꭞ ꭟ ꭩ.
  • O bloco Latin-F estendido é inteiramente sobrescrito.
  • O bloco Spacing Modifier Letters tem letras sobrescritas e símbolos usados ​​para a transcrição fonética: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
  • O bloco de extensões fonéticas tem várias letras e símbolos sobrescritos: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, grego ᵝ ᵞ ᵟ ᵠ, cirílico ᵸ, outro ᵎ ᵔ ᵕ ᵙ ᵜ. Eles têm a intenção de indicar uma articulação secundária .
  • O bloco de Suplemento de Extensões Fonéticas tem vários outros: Latim / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, grego ᶿ.
  • O bloco Cyrillic Extended-B contém dois sobrescritos cirílicos : ꚜ ꚝ.
  • O bloco georgiano contém uma letra Mkhedruli sobrescrita : ჼ.
  • O bloco Kanbun possui caracteres de anotação sobrescritos usados ​​em cópias japonesas de textos em chinês clássico : ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
  • O bloco Tifinagh tem uma letra sobrescrita: ⵯ.
  • O Unified Canadian Aboriginal Syllabics e seus blocos estendidos contêm várias letras apenas consoantes para indicar a coda da sílaba chamada Finais, junto com alguns caracteres que indicam a medial da sílaba conhecida como Medials: Bloco principal ᐩ ᐪ ᑉ ᑊ ᑋ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕐ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᔋ ᔥ ᔿ ᔿ ᕀ ᕁ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙇ ; Bloco estendido: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
Combinando sobrescrito
  • O bloco Combining Diacritical Marks contém diacríticos de letras sobrescritas medievais. Essas letras são escritas diretamente acima de outras letras que aparecem em manuscritos germânicos medievais e, portanto, esses glifos não incluem espaçamento, por exemplo, uͤ. Eles são mostrados aqui sobre o espaço reservado do círculo pontilhado ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
  • O bloco Combining Diacritical Marks Extended contém duas letras de combinação para transcrições linguísticas de escocês : ◌ᪿ ◌ᫀ.
  • O bloco do Suplemento de Combinação de Marcas Diacríticas contém letras diacríticas medievais sobrescritas, o suficiente para completar o alfabeto latino minúsculo básico, exceto para j, qey, algumas pequenas maiúsculas e ligaduras (ae, ao, av) e letras adicionais: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
  • Os blocos Cyrillic Extended-A e -B contém vários diacríticos de letras sobrescritas medievais, o suficiente para completar o alfabeto cirílico minúsculo básico usado em textos eslavos eclesiásticos, também inclui uma ligadura adicional (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
Subscrito
  • O bloco latino Extended-C contém um subscrito adicional, ⱼ.
  • O bloco Extensões Fonéticas tem várias letras e símbolos subscritos: Latim / IPA ᵢ ᵣ ᵤ ᵥ e Grego ᵦ ᵧ ᵨ ᵩ ᵪ.
Combinando subscrito

Tabelas latinas, gregas e cirílicas

Consolidado, o padrão Unicode contém versões sobrescritas e subscritas de um subconjunto de letras latinas, gregas e cirílicas. Aqui, eles são organizados em ordem alfabética para comparação (ou para conveniência de copiar e colar). Como esses caracteres aparecem em diferentes intervalos de Unicode, eles podem não ter o mesmo tamanho ou posição devido à substituição de fontes no navegador. Células sombreadas marcam letras maiúsculas pequenas que não são muito distintas de minúsculos e letras gregas que são indistinguíveis do latim e, portanto, não seriam compatíveis com Unicode.

Letras latinas sobrescritas e subscritas
UMA B C D E F G H eu J K eu M N O P Q R S T você V C X Y Z
Sobrescrito maiúsculo ᴿ
Versalete sobrescrito 𐞄 𐞒 𐞖 𐞪 𐞲
Sobrescrito minúsculo ʰ ʲ ˡ 𐞥 ʳ ˢ ʷ ˣ ʸ
Versalete pequeno ◌ᷛ ◌ᷞ ◌ᷟ ◌ᷡ ◌ᷢ
Overscript minúsculo ◌ͣ ◌ᷨ ◌ͨ ◌ͩ ◌ͤ ◌ᷫ ◌ᷚ ◌ͪ ◌ͥ ◌ᷜ ◌ᷝ ◌ͫ ◌ᷠ ◌ͦ ◌ᷮ ◌ͬ ◌ᷤ ◌ͭ ◌ͧ ◌ͮ ◌ᷱ ◌ͯ ◌ᷦ
Subscrito minúsculo
Underscript minuscule ◌᷊ ◌ᪿ
Letras sobrescritas e subscritas do grego
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
Sobrescrito minúsculo ⁽ᵋ⁾ ᶿ ⁽ᶥ⁾ ⁽ᶹ⁾
Overscript minúsculo ◌ᷩ
Subscrito minúsculo

Para IPA básico, consulte as letras sobrescritas do IPA . Outros símbolos fonéticos são,

outras letras sobrescritas e subscritas IPA
ɑ æ ç ð ə ɩ ʃ ƫ ʍ ʔ
Sobrescrito 𐞃 ᶜ̧ ˀ
Overscript ◌ᷧ ◌ᷔ ◌ᷗ ◌ᷙ ◌ᷪ ◌ᷯ ◌̉
Subscrito
Underscript ◌ᫀ
Letras cirílicas sobrescritas e subscritas
А Ә Е Є И І Ї О Ө У Ү Ѡ Ъ ЪІ Ы Ь Ѣ Э Ѥ Ю Ѫ Ѭ Ѧ
Sobrescrito * * * * * - * * * * * * * *
Overscript ◌ⷶ ◌ⷷ ◌ꙴ ◌ꙵ ◌ꙶ ◌ⷪ ◌ꙷ ◌ⷹ ◌ꙻ ◌ꙸ ◌ꙹ ◌ꙺ ◌ⷺ ◌ⷼ ◌ꚟ ◌ⷻ ◌ⷾ ◌ⷿ ◌ⷽ
Subscrito * * * * - * * * *
Б В Г Ґ Д Ж З S К Л М Н П Р С Т Ф Х Ц Ч Џ Ш Щ Ѳ
Sobrescrito * * * * * * * * * * * * * * * * * *
Overscript ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ꚞ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ
Subscrito * * * * * * * * * * * * * * * * * *

* Aceita caracteres para Unicode 15, a ser publicado em 2022.

Veja também versalete em Unicode .

Caracteres compostos

Principalmente para compatibilidade com conjuntos de caracteres anteriores, o Unicode contém vários caracteres que compõem sobrescritos e subscritos com outros símbolos. Na maioria das fontes, eles são renderizados muito melhor do que as tentativas de construir esses símbolos a partir dos caracteres acima ou usando marcação.

  • O Unified Canadian Aboriginal Syllabics e seus blocos estendidos contêm várias letras compostas com letras sobrescritas para indicar valores de som estendidos: Bloco principal ᕅ ᕔ ᕿ ᖀ ᖁ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Bloco estendido ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢼ ᢽ ᢿ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.

Notas

Referências