Método Wubi - Wubi method

Método Wubi
Chinês simplificado 五笔 字型 输入 法
Significado literal método de entrada do modelo de caractere de cinco traços
Nome alternativo chinês
Chinês simplificado 王 码
Significado literal Código Wang
O layout do teclado Wubi 98
O layout do teclado Wubi 86 (mais comum)
Um teclado QWERTY com componentes Wubi 86

O método de entrada Wubizixing ( chinês simplificado :五笔 字型 输入 法; chinês tradicional :五筆 字型 輸入 法; pinyin : wǔbǐ zìxíng shūrùfǎ ; lit. 'método de entrada do modelo de caractere de cinco traços'), muitas vezes abreviado simplesmente para Wubi ou Wubi Xing , é um método de entrada de caracteres chineses principalmente para inserir texto em chinês simplificado e chinês tradicional em um computador. Wubi não deve ser confundido com o método Wubihua (五 笔画) , que é um método de entrada diferente que compartilha a categorização em cinco tipos de traços.

O método também é conhecido como Wang Ma ( chinês simplificado :王 码; chinês tradicional :王 碼; pinyin : Wáng mǎ ; lit. 'código de Wang'), em homenagem ao inventor Wang Yongmin (王永民). Existem quatro versões Wubi que são consideradas padrão: Wubi 86, Wubi 98, Wubi 18030 e Wubi New-century (a versão de 3ª geração). Os três últimos também podem ser usados ​​para inserir texto em chinês tradicional , embora de forma mais limitada. Wubi 86 é o método de entrada baseado em forma mais amplamente conhecido e usado para teclados completos na China continental . Se também for necessário inserir caracteres chineses tradicionais com frequência, outros métodos de entrada como CangJie ou ZhengMa podem ser mais adequados para a tarefa e também é muito mais provável encontrá-los no computador que você precisa usar.

O método Wubi é baseado na estrutura dos caracteres e não na pronúncia, tornando possível inserir caracteres mesmo quando o usuário não sabe a pronúncia, além de não estar muito ligado a nenhuma variedade particular falada de chinês . Também é extremamente eficiente: quase todos os caracteres podem ser escritos com no máximo 4 pressionamentos de tecla. Na prática, a maioria dos caracteres pode ser escrita com menos. Existem relatos de digitadores experientes que atingem 160 caracteres por minuto com Wubi. O que isso significa no contexto do chinês não é inteiramente o mesmo que para o inglês, mas é verdade que o Wubi é extremamente rápido quando usado por um digitador experiente. A principal razão para isso é que, ao contrário dos métodos tradicionais de entrada fonética, não é necessário perder tempo selecionando o caractere desejado em uma lista de possibilidades homofônicas: praticamente todos os caracteres têm uma representação única.

Como o próprio nome sugere, o teclado é dividido em cinco regiões. O caractere chinês(bǐ), quando usado no contexto da escrita de caracteres chineses, refere-se às pinceladas usadas na caligrafia chinesa. Cada região é atribuída a um certo tipo de traço.

  • Região 1: horizontal (一)
  • Região 2: vertical (丨)
  • Região 3: para baixo da direita para a esquerda (丿)
  • Região 4: traços de pontos ou traços descendentes da esquerda para a direita (丶)
  • Região 5: gancho

Uma grande desvantagem de aprender Wubi é sua curva de aprendizado mais íngreme, já que, como um sistema mais complexo, leva mais tempo para ser adquirido como uma habilidade. Memorização e prática são fatores-chave para um uso proficiente.

Para usar Wubi, existem vários métodos de entrada disponíveis, incluindo Google Input Tools (usado pelo Google Translate) e opções de teclado em dispositivos Mac. As sequências Wubi podem ser pesquisadas por caracteres específicos usando dicionários online .

Neste artigo, a seguinte convenção será usada: caractere sempre significará caractere chinês, enquanto letra , tecla e pressionamento de tecla sempre se referirão às teclas do teclado.

Como funciona

Essencialmente, um personagem é dividido em componentes, que geralmente são (mas nem sempre) iguais aos radicais . Eles são digitados na ordem em que seriam escritos à mão . Para garantir que caracteres extremamente complexos não exijam um número excessivo de pressionamentos de tecla, qualquer caractere contendo mais de 4 componentes é inserido digitando-se os primeiros 3 componentes escritos, seguidos do último. Desta forma, os dados de cada personagem podem ser inseridos com no máximo 4 pressionamentos de tecla.

O Wubi distribui seus caracteres de maneira muito uniforme e, como tal, a grande maioria dos caracteres é definida de forma única pelas 4 teclas discutidas acima. Em seguida, digita-se um espaço para mover o caractere do buffer de entrada para a tela. No caso de a representação de 4 letras do caractere não ser única, deve-se digitar um dígito para selecionar o caractere relevante (por exemplo, se dois caracteres têm a mesma representação, digitar 1 selecionaria o primeiro e 2, o segundo). Na maioria das implementações, um espaço sempre pode ser digitado e simplesmente significa 1 em uma configuração ambígua. O software inteligente tentará garantir que o caractere na posição padrão seja o desejado.

Muitos personagens têm mais de uma representação. Isso às vezes é para facilitar o uso, caso haja mais de uma maneira óbvia de quebrar um caractere. Mais frequentemente, porém, é porque certos caracteres têm uma representação curta com menos de 4 letras, bem como uma representação "completa".

Para caracteres com menos de 4 componentes que não têm uma representação de forma abreviada, digita-se cada componente e, em seguida, "preenche" a representação (isto é, digita toques de tecla extras suficientes para fazer a representação 4 toques de tecla) digitando manualmente os toques do último componente, na ordem em que seriam escritos. Se houver muitos traços, deve-se escrever o máximo possível, mas colocar o último traço por último (isso reflete a regra de componente para caracteres com mais de 4 componentes descritos acima).

Uma vez que o algoritmo é entendido, pode-se digitar quase qualquer caractere com um pouco de prática, mesmo que não tenha sido digitado antes. A memória muscular garante que digitadores frequentes que usam esse método não precisem pensar sobre como os caracteres são realmente construídos, assim como a grande maioria dos digitadores ingleses não pensa muito na grafia das palavras quando escrevem.

Detalhes específicos de implementação

Muitas implementações empregam otimizações adicionais de várias palavras. Normalmente, um dígrafo comumente usado (palavra de dois caracteres) em que ambos os caracteres têm representações curtas de duas teclas pode ser combinado em uma única representação de quatro teclas que gera dois caracteres em vez de um. Existem também alguns atalhos de 3 caracteres , e até mesmo um um pouco mais longo, com motivação política. Alguns exemplos são fornecidos na seção de exemplos abaixo.

Outra característica comum é o uso da tecla 'z' como curinga. O método Wubi foi projetado com esse recurso em mente; é por isso que nenhum componente é atribuído à tecla z. Basicamente, pode-se digitar az quando não tiver certeza de qual deve ser o componente, e o método de entrada ajudará a completá-lo. Se alguém souber, por exemplo, que o caractere deve começar com "kt", mas não tiver certeza de qual deve ser o próximo componente, digitar "ktz" produzirá uma lista de todos os caracteres que começam com "kt". Na prática, porém, muitos mecanismos de método de entrada usam um método de pesquisa tabular para todos os sistemas de entrada baseados em tabela, incluindo para Wubi. Isso significa que eles simplesmente possuem uma grande tabela na memória, associando diferentes personagens às suas respectivas representações. O método de entrada então se torna simplesmente uma pesquisa de tabela. Em tal implementação, a chave z quebra o paradigma e, como tal, não é encontrada em muitos softwares generalizados (embora o método de entrada Wubi comumente encontrado no Windows chinês implemente o recurso). Por este mesmo motivo, a otimização de múltiplos caracteres descrita no parágrafo anterior também é relativamente rara.

Alguns métodos de entrada, como xcin (encontrado em muitos sistemas semelhantes ao UNIX), fornecem uma funcionalidade genérica curinga que pode ser usada em todos os sistemas de entrada baseados em tabelas, incluindo pinyin e virtualmente qualquer outro. Xcin usa '*' para autocompletar e '?' por apenas uma letra, seguindo as convenções pioneiras no agrupamento de arquivos UNIX. Outras implementações provavelmente têm suas próprias convenções.

Subdivisão do teclado

O teclado Wubi assume um layout semelhante ao QWERTY , então os usuários de teclados que implementam um layout nacionalizado ou alternativo (como o Dvorak ou o AZERTY francês ) provavelmente terão que fazer alguns remapeamentos para tornar o sistema lógico. O Wubi não posiciona seus componentes arbitrariamente: há muitos deles, e é somente com a introdução de uma metodologia lógica que o sistema se torna fácil de aprender.

Basicamente, o teclado é dividido em 5 zonas, cada uma representando um toque. Esses cinco golpes estão caindo para a esquerda, caindo para a direita, horizontal, vertical e gancho, e as zonas que os representam são QWERT, YUIOP, ASDFG, HJKLM e XCVBN, respectivamente. Essas zonas são todas dispostas horizontalmente, com exceção de M, que não está alinhado com o resto das letras em sua zona.

De uma forma geral, o teclado pode ser pensado como dividido ao centro, entre T e Y, G e H, e N e M. As teclas em cada zona são numeradas afastando-se desta linha divisória: portanto, devemos realmente dizer que na zona QWERT, T é a primeira letra, R é a segunda e E a terceira; na zona YUIOP, Y é o primeiro, U é o segundo, I o terceiro, etc. Para XCVBN, N é o primeiro e assim por diante. Em HJKLM, considere M como o último da série, embora não esteja na linha.

Isso é importante porque os componentes da primeira posição terão uma repetição do golpe em questão (o golpe atribuído à zona a que pertencem), os da segunda, duas, os da terceira, três. Os componentes que não são facilmente classificáveis ​​com este paradigma serão colocados na última letra.

Portanto, seria de se esperar que 一 estivesse localizado em G, e 二 em F e 三 em D e, de fato, este é o caso. Da mesma forma, seria de se esperar que 丨 estivesse localizado em H, 刂 em J e 川 em K. Esse padrão é válido para todas as zonas. Além disso, se estende à maioria dos radicais que parecem ser feitos de três dessas pinceladas, mesmo que na verdade nem sejam. Um exemplo disso é 中 em K: embora não tenha três traços para baixo (dois apenas), parece ter três. Além disso, é escrito à mão, primeiro escrevendo um radical de boca, 口, e depois dividindo-o ao meio com um traço vertical descendente. O radical de boca está em 'K', então isso torna a atribuição duplamente lógica. E a romanização pinyin de 口, kou3, começa com k, outro auxiliar de memória codificado no teclado Wubi.

Além disso, cada letra de cada zona tem um componente associado a ela, seu "componente principal". Geralmente, eles são um caractere completo (com exceção de X) por direito próprio. Sempre é possível digitar esse componente principal digitando a letra em que ele está localizado quatro vezes. Assim, por exemplo, o componente principal de H é 目, e assim seria digitado digitando "hhhh".

Cada letra também possui um caractere de atalho associado a ela. Em alguns casos, esse caractere é o mesmo que o componente associado à chave em questão, e às vezes não. Este caractere de atalho é o caractere produzido quando alguém digita apenas a letra e nada mais; todos esses são caracteres extremamente comuns usados ​​ao digitar chinês.

É perfeitamente possível que haja vários componentes não listados abaixo, seja por descuido, porque eles raramente são usados ​​ou porque não existe uma representação Unicode simples para o componente.

Zona QWERT (caindo à esquerda)

O principal componente da tecla Q é 金 e seu caractere de atalho é 我. Está associado aos seguintes componentes: 金, 钅, 勹, 儿, 夕, bem como o gancho no topo de 饣 e 角, o radical 犭sem o traço inferior descendente à esquerda (portanto, os caracteres com esse radical começam com " qt ", não apenas" q "), o cruzamento (como no centro de 区), o topo de 鱼 (ou seja, sem o traço horizontal na parte inferior) e os três (quase verticais)" pés " no canto inferior direito de 流.

O componente principal da tecla W e o caractere de atalho são ambos 人. Está associado aos seguintes componentes: 人, 亻, 八 e o topo de 癸. Embora 人 signifique homem, é frequentemente usado por Wubi para construir um radical de telhado, como em 会, "wfc". 入 não é governado por W, apesar de parecer semelhante, e enquanto 餐 tem um topo que se parece vagamente com o topo de 癸, os dois não são iguais (na verdade, para digitar 餐, é necessário digitar fisicamente cada componente no topo) .

O principal componente da tecla E é 月, e seu caractere de atalho é 有. Está associado aos seguintes componentes: 月, 用, 彡, 乃, a parte inferior de 衣 (ou seja, sem 亠), a parte superior de 孚 (ou seja, sem 子), 豕 (porco), a parte inferior de 良 (ou seja, sem o 白), e a parte inferior de 舟 (ou seja, sem o pontinho no topo). Neste caso, o caractere de atalho de E nem mesmo começa com um traço descendente para a esquerda, mas apenas figura proeminentemente um componente pertencente a E. 彡 é apresentado neste caractere, pois é o terceiro caractere na zona (contando de T, consulte acima de). Uma distorção particular que surge frequentemente é o uso de E em 且 e em caracteres que o contenham: Wubi pensa neste componente como 月 + 一.

O principal componente da tecla R é 白, e seu caractere de atalho é 的. Está associado aos seguintes componentes: 白, 手, 扌, 斤 (ambos com e sem o T), 牛 ( sem o curso vertical descendente) e, claro, os dois movimentos descendentes para a esquerda 𰀪 que se esperaria do segundo na zona (veja a explicação acima). Cuidado com as variedades de 手 onde o gancho central para baixo é substituído por um golpe que cai para a esquerda, como em 看.

O principal componente da tecla T é 禾, e seu caractere de atalho é 和. Ele está associado aos seguintes componentes: 禾, 竹, 夂, 攵, 彳 e o topo de 乞 (ou seja, sem o 乙). 竹 também pode ser encontrado em sua forma menor (⺮). 丿 também é encontrado nesta chave, porque T é a primeira chave na zona (veja acima). Isso significa que se alguém estiver digitando um componente ou caractere traço por traço, eles (geralmente) usariam T para representar um traço que caia para a esquerda. Consulte a seção sobre golpes de desambiguação para obter mais informações sobre exceções a esta regra.

Zona YUIOP (caindo para a direita)

Esta zona também pode ser chamada de zona de pontos, porque seu padrão de Y: 讠 U: 冫 I: 氵 e O: 灬 não é necessariamente formado por golpes de queda para a direita. Na verdade, pode-se argumentar que o primeiro golpe em 灬 realmente cai para a esquerda . É chamada de zona de queda para a direita porque as teclas nesta zona, quando usadas para construir um caractere por traço (ao invés de componente), todas representam traços de queda para a direita para alguma configuração de caractere (consulte a seção sobre traços de desambiguação para mais informações).

O principal componente da tecla Y é 言 e seu caractere de atalho é 主. Está associado aos seguintes componentes: 言, 讠, 亠, 亠 com um 口 abaixo dele, 广, 文, 方 e 丶. Todos esses componentes começam com um golpe de queda para a direita. Geralmente, pontos em caracteres chineses são realmente deixou cair acidentes vasculares cerebrais, e por isso na maioria das vezes, o uso de T é mais apropriado do que Y. É claro que, se se pode escrever os caracteres chineses à mão, eles devem ser capazes de dizer que para escolher ao relembrar como está escrito.

O principal componente da tecla U é 立 e seu caractere de atalho é 产. Está associado aos seguintes componentes: 立, 六, 辛, 门, 疒, 丬, 冫, as "antenas" na parte superior de 单 (apenas dois traços: 丷), e as antenas mais um traço horizontal, conforme encontrado em o topo de 兹. A maioria deles apresenta dois traços diagonais curtos (门 sendo a exceção óbvia). Isso é consistente com a posição de U como a segunda letra na zona (veja uma explicação acima).

O principal componente da tecla I é 水, e seu caractere de atalho é 不. Está associado aos seguintes componentes: 水, 氵, 小, os três traços no topo de 学 e os três traços no topo de 当. Além disso, um componente que pode ser descrito como dois 冫, costas com costas, está associado a este caractere.

O principal componente da tecla O é 火, e seu caractere de atalho é 为. Está associado aos seguintes componentes: 火, 米, 灬 e 业sem o traço horizontal inferior - permite a construção de caracteres como 严. Esta é a quarta chave na zona de queda à direita: daí a inclusão de 灬.

O principal componente da tecla P é 之, e seu caractere de atalho é 这. Está associado aos seguintes componentes: 之, 辶, 廴, 冖, 宀 e 礻. Como os componentes Wubi são digitados na ordem em que precisariam ser escritos se um fosse escrito à mão, os componentes 辶 e 廴 são tipicamente digitados por último .

Zona ASDFG (horizontal)

  • O caractere de atalho da tecla A é 工.
  • O principal componente da tecla S é 木, e seu caractere de atalho é 要.
  • O principal componente da tecla D é 大, e seu caractere de atalho é 在.
  • O principal componente da tecla F é 土, e seu caractere de atalho é 地. O nome do componente principal (terra) corresponde ao caractere de atalho que significa terra.
  • O principal componente da tecla G é 王, e seu caractere de atalho é 一.

Zona HJKLM (vertical)

  • O principal componente da tecla H é 目, e seu caractere de atalho é 上.
  • O principal componente da tecla J é 日, e seu caractere de atalho é 是.
  • O principal componente da tecla K é 口 e seu caractere de atalho é 中.
  • O principal componente da tecla L é 田, e seu caractere de atalho é 国.
  • O principal componente da tecla M é 山 e seu caractere de atalho é 同.

Zona XCVBN (gancho)

  • O principal componente da tecla X é 纟, e seu caractere de atalho é 经.
  • O principal componente da tecla C é 又 e seu caractere de atalho é 以.
  • O principal componente da tecla V é 女, e seu caractere de atalho é 发.
  • O principal componente da tecla B é 子, e seu caractere de atalho é 了.
  • O principal componente da tecla N é 已, e seu caractere de atalho é 民.

Golpes de desambiguação

Os toques do teclado são divididos em 5 zonas

Zonas Carta
1 GFDSA
2 HJKLM
3 TREWQ
4 YUIOP
5 NBVCX


Zonas Golpe Forma
1 Esquerda-Direita (Horizontal)
2 Topo-Fundo (Vertical)
3 丿 Caindo para a esquerda
4 Caindo certo
5 Gancho

Exemplos

Personagens com 4 componentes ou menos (mas sem necessidade de traços)

Exemplo 1: 请 Consiste em três componentes: y (讠, radical # 10), g (王 *, radical 89), e (月, radical 118) -> 请

Personagens com mais de 4 componentes

Exemplo 2: 遗

Consiste em cinco componentes: k (口), h (丨), g (一), m (贝), p (辶) -> khgp -> 遗 (você não precisa digitar m)

Personagens com menos de 4 componentes (precisando de golpes)

Exemplo 3a: 文 : Primeiro você digita a chave com o símbolo, que é 'Y'. Então você digita o primeiro componente, que também é 'Y' para o traço 点, então um 'G' para o traço 横 , e como agora você já tem três traços, você digita o último toque, que também passa a ser um 捺, chegando ao código-chave 'YYGY' para o caractere completo.

Exemplo 3b: 一 : O código para este caractere é 'GGLL'. Como antes, você digita a chave do caractere primeiro, que é 'G', depois o primeiro toque desse caractere, que também é um 'G'. Como todas essas informações são necessárias, o L é usado como preenchimento até chegar a 4 letras. Observe que o '一' também é o caractere de atalho para 'G' (tornando-o um toque apenas na prática).

Exemplo 3c: 广 : O código para este personagem é 'YYGT'. Primeiramente, você digita a chave onde este caractere está localizado, que é um 'Y'. Em seguida, você digita um traço 点, que também está em 'Y'. O próximo será o traço 横 em 'G', e o último será o 捺, em 'T'.

Personagens que requerem golpes de desambiguação

Exemplo 4: 等

Consiste em três componentes: t (竹), f (土), f (寸),

Traços de desambiguação: o último traço é 丶 e o caractere é com estrutura de cima para baixo (42, u) -> 等

Poema

Foi feito um poema como mnemônico para o teclado Wubi, associando poucos caracteres a cada tecla. O primeiro caractere é o componente principal principal correspondente, enquanto os próximos são componentes ou caracteres associados.

Versão 1986

G11 王 旁 青 头 戋 五一

F12 土 士 二 干 十 寸 雨

D13 大 犬 三 羊 古 石 厂

S14 木 丁西

A15 工 戈 草 头 右 框 七

H21 目 具 上 止 卜 虎皮

J22日早两竖与虫依

K23 口 与 川 , 字根 稀

L24 田 甲方 框 四 车 力

M25 山 由 贝, 下 框 几

T31 禾 竹 一 撇 双人 立, 反 文 条 头 共 三.

R32 白手 看头 三 二斤

E33月彡 (衫) 乃 用 家 衣 底

W34 人和 八 , 登 祭 头

Q35 金 勺 缺点 无 尾 鱼, 犬 旁 留 义 儿 一点 夕, 氏 无.

Y41 言 文 方 广 在 四 一, 高 头 一 捺 谁人 去

U42 立 辛 两点 六 门 疒 (病)

I43 水 旁 兴头 小 倒立

O44 火 业 头 , 四 点 米

P45 之 宝盖 , 摘 示 衣

N51 已 半 巳 满 不出 己, 左 框 折 尸 心 和.

B52 子 耳 了 也 框 向上

V53 女 刀 九 臼 山 朝西

C54 又 巴马 , 丢 矢 矣

X55 慈母 无心 弓 和 匕, 幼 无力

Versão de 1998

G11 王 旁 青 头 五 夫 一

F12 土 干 十 寸 未 甘雨, 不要 忘 了 革 字 底

D13 大 犬 戊 其 古 石 厂

S14 木 丁西 甫一 四 里

A15 工 戈 草 头 右 框 七

H21 目 上 卜 止 虎 具 头

J22 日 早 两 竖 与 虫 依

K23 口 流川 , 码 元 稀

L24 田 甲方 框 四 车里

M25 山 由 贝 骨 下 框 集 

T31 禾 竹 反 文 双人 立

R32 白 斤 气 丘 叉 手提

E33 月 用力 豸 毛衣 臼

W34 人 八 登 头 单 人 几

Q35 金 夕 鸟儿 犭 边 鱼

Y41 言 文 方 点 谁人 去

U42 立 辛 六 羊 病 门 里

I43 水族 三点 鳖 头 小

O44 火 业 广 鹿 四 点 米

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽

B52 子 耳 了 也 乃 框 皮

V53 女 刀 九 良 山西 倒

C54 又 巴 牛 入 马 失蹄

X55 幺 母 贯 头 弓 和 匕

Versão do novo século (3ª geração)

G11 王 旁 青 头 五一 提 

F12 土 士 二 干 十 寸 雨

D13 大三 肆 头 古 石 厂 

S14 木 丁西 边 要 无 女 

A15 工 戈 草 头 右 框 七

H21 目 止 具 头 卜 虎皮 

J22 日 曰 两 竖 与 虫 依 

K23 口中 两 川 三个 竖

L24 田 框 四 车 甲 单 底 

M25 山 由 贝 骨 下 框里

T31 禾 竹 牛 旁 卧 人 立 

R32 白 斤 气 头 叉 手提 

E33 月 舟 衣 力 豕 豸 臼 

W34 人 八 登 祭 风头 几 

Q35 金 夕 犭 儿 包头 鱼

Y41 言 文 方 点 在 四 一 

U42 立 带 两点 病 门 里 

I43 水边 一族 三点 小 

O44 火 变 三 态 广 二 米 

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽 

B52 子 耳 了 也 乃 齿 底 

V53 女 刀 九 巡 录 无水 

C54 又 巴 甬 矣 马 失蹄 

X55 幺 母 绞 丝 弓 三 匕

Em média

Em 2020, a história de Wubi foi apresentada em um episódio do Radiolab intitulado "O Efeito Wubi".

Notas e referências

links externos