Subscritos e sobrescritos Unicode - Unicode subscripts and superscripts
O Unicode tem versões subscritas e sobrescritas de vários caracteres, incluindo um conjunto completo de algarismos arábicos . Esses caracteres permitem que qualquer equação polinomial , química e outras equações sejam representadas em texto simples, sem usar qualquer forma de marcação como HTML ou TeX .
O World Wide Web Consortium e o Unicode Consortium fizeram recomendações sobre a escolha entre usar marcação e usar caracteres sobrescritos e subscritos:
Quando usado em contexto matemático ( MathML ), é recomendado o uso consistente de marcação de estilo para sobrescritos e subscritos .... No entanto, quando super e subscritos devem refletir distinções semânticas, é mais fácil trabalhar com esses significados codificados no texto. do que a marcação, por exemplo, na transcrição fonética ou fonêmica .
Usos
O uso pretendido quando esses caracteres foram adicionados ao Unicode era permitir que fórmulas químicas e álgebraicas e fonéticas fossem escritas sem marcação, mas produzissem sobrescritos e subscritos verdadeiros. Assim, "H₂O" (usando um caractere subscrito) é suposto ser idêntico a "H 2 O" (com marcação subscrito).
Na realidade, a maioria das fontes que incluem esses caracteres ignoram a definição Unicode e projetam os dígitos para os glifos matemáticos do numerador e do denominador , que são menores do que os caracteres normais, mas estão alinhados com a linha final e a linha de base , respectivamente. Quando usados com o solidus , esses glifos são úteis para fazer frações diagonais arbitrárias (semelhantes ao ½ glifo). Fazendo frações usando software existente de super / subscritos exige muitos personagens e não se parece com a fração prestados (exemplo: 1 / 2 ), os designers de modo fonte desde que esta alternativa. Isso também torna as letras sobrescritas úteis para indicadores ordinais , correspondendo melhor aos caracteres ª e º. No entanto, isso os torna incorretos para super e subscritos normais, e as fórmulas são renderizadas corretamente usando marcação em vez desses caracteres.
O Unicode pretendia produzir frações diagonais por meio de um mecanismo diferente, mas é muito mal suportado. A barra de fração U + 2044 é visualmente semelhante ao solidus, mas quando usada com os dígitos comuns (não os sobrescritos e subscritos) tem como objetivo informar a um sistema de layout que uma fração como ¾ deve ser renderizada usando a substituição automática de glifos para os dígitos . Alguns navegadores suportam isso, mas não em todas as fontes. Uma seleção de fontes é mostrada na tabela abaixo.
Personagens | Fonte | Resultado |
---|---|---|
U + 00BD ½ FRAÇÃO VULGAR METADE | Predefinição | ½ |
U + 00B9 ¹ SUPERSCRIPT ONE , U + 002F / SOLIDUS , U + 2082 ₂ ASSINATURA DOIS | ¹ / ₂ | |
U + 00B9 ¹ SUPERSCRIPT ONE , U + 2044 ⁄ FRACTION SLASH , U + 2082 ₂ ASSINATURA DOIS | ¹⁄₂ | |
U + 0031 1 DÍGITO UM , U + 2044 ⁄ CORTE DE FRAÇÃO , U + 0032 2 DÍGITO DOIS |
1⁄2 | |
Arial | 1⁄2 | |
Cambria | 1⁄2 | |
Consolas | 1⁄2 | |
Times New Roman | 1⁄2 | |
FiraGO | 1⁄2 | |
EB Garamond | 1⁄2 | |
Cantarell | 1⁄2 | |
Lato | 1⁄2 | |
Linux Libertine O | 1⁄2 | |
Nimbus Roman | 1⁄2 | |
Ubuntu | 1⁄2 | |
Yrsa | 1⁄2 |
Bloco de sobrescritos e subscritos
Os dígitos sobrescritos mais comuns (1, 2 e 3) estavam no ISO-8859-1 e, portanto, foram transportados para as posições na faixa Latin-1 do Unicode. O resto foi colocado em uma seção dedicada do Unicode em U + 2070 a U + 209F. As duas tabelas abaixo mostram esses personagens. Cada caractere sobrescrito ou subscrito é precedido por um x normal para mostrar o subscrito / sobrescrito. A tabela à esquerda contém os caracteres Unicode reais; o da direita contém os equivalentes usando marcação HTML para o subscrito ou sobrescrito.
|
|
Outros caracteres sobrescritos e subscritos
O Unicode versão 13.0 também inclui caracteres subscritos e sobrescritos destinados ao uso semântico, nos seguintes blocos:
- Sobrescrito
- O bloco do Suplemento Latim-1 contém os indicadores ordinais feminino e masculino ª e º.
- O bloco latino Extended-C contém um sobrescrito adicional, ⱽ.
- O bloco Latim Extended-D contém cinco sobrescritos: ꝰ ꟸ ꟹ ꟲ ꟳ.
- O bloco latino Extended-E contém cinco sobrescritos: ꭜ ꭝ ꭞ ꭟ ꭩ.
- O bloco Latin-F estendido é inteiramente sobrescrito.
- O bloco Spacing Modifier Letters tem letras sobrescritas e símbolos usados para a transcrição fonética: ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ˀ ˁ ˠ ˡ ˢ ˣ ˤ.
- O bloco de extensões fonéticas tem várias letras e símbolos sobrescritos: Latin / IPA ᴬ ᴭ ᴮ ᴯ ᴰ ᴱ ᴲ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᴹ ᴺ ᴻ ᴼ ᴽ ᴾ ᴿ ᵀ ᵁ ᵂ ᵃ ᵄ ᵅ ᵆ ᵆ ᵇ ᵈ ᵉ ᵊ ᵋ ᵌ ᵍ ᵏ ᵐ ᵑ ᵒ ᵓ ᵖ ᵗ ᵘ ᵚ ᵛ, grego ᵝ ᵞ ᵟ ᵠ, cirílico ᵸ, outro ᵎ ᵔ ᵕ ᵙ ᵜ. Eles têm a intenção de indicar uma articulação secundária .
- O bloco de Suplemento de Extensões Fonéticas tem vários outros: Latim / IPA ᶛ ᶜ ᶝ ᶞ ᶟ ᶠ ᶡ ᶢ ᶣ ᶤ ᶥ ᶦ ᶧ ᶨ ᶩ ᶪ ᶪ ᶫ ᶬ ᶭ ᶮ ᶯ ᶯ ᶰ ᶱ ᶲ ᶳ ᶴ ᶵ ᶶ ᶷ ᶷ ᶸ ᶹ ᶺ ᶻ ᶼ ᶽ ᶾ, grego ᶿ.
- O bloco Cyrillic Extended-B contém dois sobrescritos cirílicos : ꚜ ꚝ.
- O bloco georgiano contém uma letra Mkhedruli sobrescrita : ჼ.
- O bloco Kanbun possui caracteres de anotação sobrescritos usados em cópias japonesas de textos em chinês clássico : ㆒ ㆓ ㆔ ㆕ ㆖ ㆗ ㆗ ㆘ ㆙ ㆚ ㆛ ㆜ ㆝ ㆞ ㆟.
- O bloco Tifinagh tem uma letra sobrescrita: ⵯ.
- O Unified Canadian Aboriginal Syllabics e seus blocos estendidos contêm várias letras apenas consoantes para indicar a coda da sílaba chamada Finais, junto com alguns caracteres que indicam a medial da sílaba conhecida como Medials: Bloco principal ᐩ ᐪ ᑉ ᑊ ᑋ ᑋ ᒃ ᒄ ᒡ ᒢ ᒻ ᒻ ᒼ ᒽ ᒾ ᓐ ᓑ ᓒ ᓪ ᓫ ᔅ ᔆ ᔇ ᔈ ᔉ ᔊ ᔋ ᔥ ᔾ ᔿ ᕀ ᕁ ᕐ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᔋ ᔥ ᔿ ᔿ ᕀ ᕁ ᕐ ᕑ ᕝ ᕪ ᕻ ᕯ ᕽ ᖅ ᖕ ᖖ ᖟ ᖦ ᖮ ᗮ ᘁ ᙆ ᙇ ᙇ ; Bloco estendido: ᣔ ᣕ ᣖ ᣗ ᣘ ᣙ ᣚ ᣛ ᣜ ᣝ ᣞ ᣟ ᣳ ᣴ ᣵ.
- Combinando sobrescrito
- O bloco Combining Diacritical Marks contém diacríticos de letras sobrescritas medievais. Essas letras são escritas diretamente acima de outras letras que aparecem em manuscritos germânicos medievais e, portanto, esses glifos não incluem espaçamento, por exemplo, uͤ. Eles são mostrados aqui sobre o espaço reservado do círculo pontilhado ◌: ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ.
- O bloco Combining Diacritical Marks Extended contém duas letras de combinação para transcrições linguísticas de escocês : ◌ᪿ ◌ᫀ.
- O bloco do Suplemento de Combinação de Marcas Diacríticas contém letras diacríticas medievais sobrescritas, o suficiente para completar o alfabeto latino minúsculo básico, exceto para j, qey, algumas pequenas maiúsculas e ligaduras (ae, ao, av) e letras adicionais: ◌ᷓ ◌ ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ ᷭ ◌ᷮ ◌ᷯ ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ.
- Os blocos Cyrillic Extended-A e -B contém vários diacríticos de letras sobrescritas medievais, o suficiente para completar o alfabeto cirílico minúsculo básico usado em textos eslavos eclesiásticos, também inclui uma ligadura adicional (ст): ◌ⷠ ◌ⷡ ◌ⷢ ◌ⷣ ◌ⷤ ◌ ⷥ ◌ⷦ ◌ⷧ ◌ⷨ ◌ⷩ ◌ⷩ ◌ⷪ ◌ⷫ ◌ⷬ ◌ⷭ ◌ⷮ ◌ⷯ ◌ⷰ ◌ⷱ ◌ⷲ ◌ⷳ ◌ⷴ ◌ⷵ ◌ⷶ ◌ⷶ ◌ⷷ ◌ⷸ ◌ⷹ ◌ⷺ ◌ⷻ ◌ⷼ ◌ⷽ ◌ ⷾ ◌ⷿ ◌ꙴ ◌ꙵ ◌ꙶ ◌ꙷ ◌ꙸ ◌ꙹ ◌ꙺ ◌ꙻ ◌ꚞ ◌ꚟ.
- Subscrito
- O bloco latino Extended-C contém um subscrito adicional, ⱼ.
- O bloco Extensões Fonéticas tem várias letras e símbolos subscritos: Latim / IPA ᵢ ᵣ ᵤ ᵥ e Grego ᵦ ᵧ ᵨ ᵩ ᵪ.
- Combinando subscrito
- O bloco do Suplemento de Marcas Diacríticas Combinando contém um subscrito de combinação: ◌᷊.
Tabelas latinas, gregas e cirílicas
Consolidado, o padrão Unicode contém versões sobrescritas e subscritas de um subconjunto de letras latinas, gregas e cirílicas. Aqui, eles são organizados em ordem alfabética para comparação (ou para conveniência de copiar e colar). Como esses caracteres aparecem em diferentes intervalos de Unicode, eles podem não ter o mesmo tamanho ou posição devido à substituição de fontes no navegador. Células sombreadas marcam letras maiúsculas pequenas que não são muito distintas de minúsculos e letras gregas que são indistinguíveis do latim e, portanto, não seriam compatíveis com Unicode.
UMA | B | C | D | E | F | G | H | eu | J | K | eu | M | N | O | P | Q | R | S | T | você | V | C | X | Y | Z | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Sobrescrito maiúsculo | ᴬ | ᴮ | ꟲ | ᴰ | ᴱ | ꟳ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴼ | ᴾ | ꟴ | ᴿ | ᵀ | ᵁ | ⱽ | ᵂ | ||||
Versalete sobrescrito | 𐞄 | 𐞒 | 𐞖 | ᶦ | ᶫ | ᶰ | 𐞪 | ᶸ | 𐞲 | |||||||||||||||||
Sobrescrito minúsculo | ᵃ | ᵇ | ᶜ | ᵈ | ᵉ | ᶠ | ᵍ | ʰ | ⁱ | ʲ | ᵏ | ˡ | ᵐ | ⁿ | ᵒ | ᵖ | 𐞥 | ʳ | ˢ | ᵗ | ᵘ | ᵛ | ʷ | ˣ | ʸ | ᶻ |
Versalete pequeno | ◌ᷛ | ◌ᷞ | ◌ᷟ | ◌ᷡ | ◌ᷢ | |||||||||||||||||||||
Overscript minúsculo | ◌ͣ | ◌ᷨ | ◌ͨ | ◌ͩ | ◌ͤ | ◌ᷫ | ◌ᷚ | ◌ͪ | ◌ͥ | ◌ᷜ | ◌ᷝ | ◌ͫ | ◌ᷠ | ◌ͦ | ◌ᷮ | ◌ͬ | ◌ᷤ | ◌ͭ | ◌ͧ | ◌ͮ | ◌ᷱ | ◌ͯ | ◌ᷦ | |||
Subscrito minúsculo | ₐ | ₑ | ₕ | ᵢ | ⱼ | ₖ | ₗ | ₘ | ₙ | ₒ | ₚ | ᵣ | ₛ | ₜ | ᵤ | ᵥ | ₓ | |||||||||
Underscript minuscule | ◌᷊ | ◌ᪿ |
Α | Β | Γ | Δ | Ε | Ζ | Η | Θ | Ι | Κ | Λ | Μ | Ν | Ξ | Ο | Π | Ρ | Σ | Τ | Υ | Φ | Χ | Ψ | Ω | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Sobrescrito minúsculo | ᵝ | ᵞ | ᵟ | ⁽ᵋ⁾ | ᶿ | ⁽ᶥ⁾ | ⁽ᶹ⁾ | ᵠ | ᵡ | |||||||||||||||
Overscript minúsculo | ◌ᷩ | |||||||||||||||||||||||
Subscrito minúsculo | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ |
Para IPA básico, consulte as letras sobrescritas do IPA . Outros símbolos fonéticos são,
ɑ | æ | ç | ð | ə | ɩ | ᶅ | ʃ | ƫ | ʍ | ʔ | |
---|---|---|---|---|---|---|---|---|---|---|---|
Sobrescrito | ᵅ | 𐞃 | ᶜ̧ | ᶞ | ᵊ | ᶥ | ᶪ | ᶴ | ᶵ | ꭩ | ˀ |
Overscript | ◌ᷧ | ◌ᷔ | ◌ᷗ | ◌ᷙ | ◌ᷪ | ◌ᷯ | ◌̉ | ||||
Subscrito | ₔ | ||||||||||
Underscript | ◌ᫀ |
А | Ә | Е | Є | И | І | Ї | О | Ө | У | Ү | Ꙋ | Ѡ | Ъ | ЪІ | Ы | Ь | Ѣ | Ꙗ | Э | Ѥ | Ю | Ѫ | Ѭ | Ѧ | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Sobrescrito | * | * | * | * | * | - | * | * | * | * | ꚜ | * | * | ꚝ | * | * | |||||||||
Overscript | ◌ⷶ | ◌ⷷ | ◌ꙴ | ◌ꙵ | ◌ꙶ | ◌ⷪ | ◌ꙷ | ◌ⷹ | ◌ꙻ | ◌ꙸ | ◌ꙹ | ◌ꙺ | ◌ⷺ | ◌ⷼ | ◌ꚟ | ◌ⷻ | ◌ⷾ | ◌ⷿ | ◌ⷽ | ||||||
Subscrito | * | * | * | * | - | * | * | * | * | ||||||||||||||||
Б | В | Г | Ґ | Д | Ж | З | S | К | Л | М | Н | П | Р | С | Т | Ф | Х | Ц | Ч | Џ | Ш | Щ | Ѳ | ||
Sobrescrito | * | * | * | * | * | * | * | * | * | ᵸ | * | * | * | * | * | * | * | * | * | ||||||
Overscript | ◌ⷠ | ◌ⷡ | ◌ⷢ | ◌ⷣ | ◌ⷤ | ◌ⷥ | ◌ⷦ | ◌ⷧ | ◌ⷨ | ◌ⷩ | ◌ⷫ | ◌ⷬ | ◌ⷭ | ◌ⷮ | ◌ꚞ | ◌ⷯ | ◌ⷰ | ◌ⷱ | ◌ⷲ | ◌ⷳ | ◌ⷴ | ||||
Subscrito | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * | * |
* Aceita caracteres para Unicode 15, a ser publicado em 2022.
Veja também versalete em Unicode .
Caracteres compostos
Principalmente para compatibilidade com conjuntos de caracteres anteriores, o Unicode contém vários caracteres que compõem sobrescritos e subscritos com outros símbolos. Na maioria das fontes, eles são renderizados muito melhor do que as tentativas de construir esses símbolos a partir dos caracteres acima ou usando marcação.
- O bloco do suplemento Latin-1 contém as frações pré-compostas ½, ¼ e ¾. Os sinais de copyright © e marca registrada ® também estão neste bloco.
- O bloco de Pontuação geral contém o sinal de permille ‰ e o sinal por dez mil ‱, e o latim básico tem o sinal de porcentagem %.
- O bloco Number Forms contém várias frações pré-compostas: ⅐ ⅑ ⅒ ⅓ ⅔ ⅕ ⅖ ⅗ ⅘ ⅙ ⅙ ⅚ ⅛ ⅜ ⅝ ⅞ ⅟ ↉.
- O bloco Letterlike Symbols contém alguns símbolos compostos de caracteres subscritos e sobrescritos: ℀ ℁ ℅ ℆ № ℠ ™ ⅍.
- O bloco do suplemento alfanumérico incluído contém três abreviações sobrescritas 🅪 🅫 🅬: MC para marque de commerce ( marca comercial ), MD para marque déposée ( marca registrada ), ambas usadas no Canadá; MR para marca registrada (marca registrada) em países de língua espanhola e portuguesa
- O bloco Técnico Diverso possui um subscrito adicional, um subscrito 10 (⏨), para fins de notação científica .
- O Unified Canadian Aboriginal Syllabics e seus blocos estendidos contêm várias letras compostas com letras sobrescritas para indicar valores de som estendidos: Bloco principal ᕅ ᕔ ᕿ ᖀ ᖁ ᖁ ᖂ ᖃ ᖄ ᖎ ᖏ ᖐ ᖑ ᖒ ᖓ ᖔ ᙯ ᙰ ᙱ ᙲ ᙳ ᙴ ᙵ ᙶ, Bloco estendido ᢰ ᢱ ᢲ ᢳ ᢴ ᢵ ᢶ ᢷ ᢸ ᢹ ᢺ ᢻ ᢼ ᢼ ᢽ ᢿ ᢿ ᣀ ᣁ ᣂ ᣃ ᣄ ᣅ.