Método Wubi - Wubi method

Método Wubi
Método Wubi
Chinês simplificado	五笔字型输入法
Significado literal	método de entrada do modelo de caractere de cinco traços
Hanyu Pinyin
Transcrições
Mandarim padrão
Hanyu Pinyin	wǔbǐ zìxíng shūrùfǎ
Wade – Giles	wupi tzuhsing shujufa
Yue: cantonês
Jyutping	ng5bat1 zi6jing4 syu1jap6faat3
Nome alternativo chinês
Chinês simplificado	王码
Significado literal	Código Wang
Hanyu Pinyin
Transcrições
Mandarim padrão
Hanyu Pinyin	wáng mǎ
Wade – Giles	Wang ma
Yue: cantonês
Jyutping	Wong4 maa5

O layout do teclado Wubi 98

O layout do teclado Wubi 86 (mais comum)

Um teclado QWERTY com componentes Wubi 86

O método de entrada Wubizixing ( chinês simplificado :五笔字型输入法; chinês tradicional :五筆字型輸入法; pinyin : wǔbǐ zìxíng shūrùfǎ ; lit. 'método de entrada do modelo de caractere de cinco traços'), muitas vezes abreviado simplesmente para Wubi ou Wubi Xing , é um método de entrada de caracteres chineses principalmente para inserir texto em chinês simplificado e chinês tradicional em um computador. Wubi não deve ser confundido com o método Wubihua (五笔画) , que é um método de entrada diferente que compartilha a categorização em cinco tipos de traços.

O método também é conhecido como Wang Ma ( chinês simplificado :王码; chinês tradicional :王碼; pinyin : Wáng mǎ ; lit. 'código de Wang'), em homenagem ao inventor Wang Yongmin (王永民). Existem quatro versões Wubi que são consideradas padrão: Wubi 86, Wubi 98, Wubi 18030 e Wubi New-century (a versão de 3ª geração). Os três últimos também podem ser usados para inserir texto em chinês tradicional , embora de forma mais limitada. Wubi 86 é o método de entrada baseado em forma mais amplamente conhecido e usado para teclados completos na China continental . Se também for necessário inserir caracteres chineses tradicionais com frequência, outros métodos de entrada como CangJie ou ZhengMa podem ser mais adequados para a tarefa e também é muito mais provável encontrá-los no computador que você precisa usar.

O método Wubi é baseado na estrutura dos caracteres e não na pronúncia, tornando possível inserir caracteres mesmo quando o usuário não sabe a pronúncia, além de não estar muito ligado a nenhuma variedade particular falada de chinês . Também é extremamente eficiente: quase todos os caracteres podem ser escritos com no máximo 4 pressionamentos de tecla. Na prática, a maioria dos caracteres pode ser escrita com menos. Existem relatos de digitadores experientes que atingem 160 caracteres por minuto com Wubi. O que isso significa no contexto do chinês não é inteiramente o mesmo que para o inglês, mas é verdade que o Wubi é extremamente rápido quando usado por um digitador experiente. A principal razão para isso é que, ao contrário dos métodos tradicionais de entrada fonética, não é necessário perder tempo selecionando o caractere desejado em uma lista de possibilidades homofônicas: praticamente todos os caracteres têm uma representação única.

Como o próprio nome sugere, o teclado é dividido em cinco regiões. O caractere chinês笔(bǐ), quando usado no contexto da escrita de caracteres chineses, refere-se às pinceladas usadas na caligrafia chinesa. Cada região é atribuída a um certo tipo de traço.

Região 1: horizontal (一)
Região 2: vertical (丨)
Região 3: para baixo da direita para a esquerda (丿)
Região 4: traços de pontos ou traços descendentes da esquerda para a direita (丶)
Região 5: gancho

Uma grande desvantagem de aprender Wubi é sua curva de aprendizado mais íngreme, já que, como um sistema mais complexo, leva mais tempo para ser adquirido como uma habilidade. Memorização e prática são fatores-chave para um uso proficiente.

Para usar Wubi, existem vários métodos de entrada disponíveis, incluindo Google Input Tools (usado pelo Google Translate) e opções de teclado em dispositivos Mac. As sequências Wubi podem ser pesquisadas por caracteres específicos usando dicionários online .

Neste artigo, a seguinte convenção será usada: caractere sempre significará caractere chinês, enquanto letra , tecla e pressionamento de tecla sempre se referirão às teclas do teclado.

Como funciona

Essencialmente, um personagem é dividido em componentes, que geralmente são (mas nem sempre) iguais aos radicais . Eles são digitados na ordem em que seriam escritos à mão . Para garantir que caracteres extremamente complexos não exijam um número excessivo de pressionamentos de tecla, qualquer caractere contendo mais de 4 componentes é inserido digitando-se os primeiros 3 componentes escritos, seguidos do último. Desta forma, os dados de cada personagem podem ser inseridos com no máximo 4 pressionamentos de tecla.

O Wubi distribui seus caracteres de maneira muito uniforme e, como tal, a grande maioria dos caracteres é definida de forma única pelas 4 teclas discutidas acima. Em seguida, digita-se um espaço para mover o caractere do buffer de entrada para a tela. No caso de a representação de 4 letras do caractere não ser única, deve-se digitar um dígito para selecionar o caractere relevante (por exemplo, se dois caracteres têm a mesma representação, digitar 1 selecionaria o primeiro e 2, o segundo). Na maioria das implementações, um espaço sempre pode ser digitado e simplesmente significa 1 em uma configuração ambígua. O software inteligente tentará garantir que o caractere na posição padrão seja o desejado.

Muitos personagens têm mais de uma representação. Isso às vezes é para facilitar o uso, caso haja mais de uma maneira óbvia de quebrar um caractere. Mais frequentemente, porém, é porque certos caracteres têm uma representação curta com menos de 4 letras, bem como uma representação "completa".

Para caracteres com menos de 4 componentes que não têm uma representação de forma abreviada, digita-se cada componente e, em seguida, "preenche" a representação (isto é, digita toques de tecla extras suficientes para fazer a representação 4 toques de tecla) digitando manualmente os toques do último componente, na ordem em que seriam escritos. Se houver muitos traços, deve-se escrever o máximo possível, mas colocar o último traço por último (isso reflete a regra de componente para caracteres com mais de 4 componentes descritos acima).

Uma vez que o algoritmo é entendido, pode-se digitar quase qualquer caractere com um pouco de prática, mesmo que não tenha sido digitado antes. A memória muscular garante que digitadores frequentes que usam esse método não precisem pensar sobre como os caracteres são realmente construídos, assim como a grande maioria dos digitadores ingleses não pensa muito na grafia das palavras quando escrevem.

Detalhes específicos de implementação

Muitas implementações empregam otimizações adicionais de várias palavras. Normalmente, um dígrafo comumente usado (palavra de dois caracteres) em que ambos os caracteres têm representações curtas de duas teclas pode ser combinado em uma única representação de quatro teclas que gera dois caracteres em vez de um. Existem também alguns atalhos de 3 caracteres , e até mesmo um um pouco mais longo, com motivação política. Alguns exemplos são fornecidos na seção de exemplos abaixo.

Outra característica comum é o uso da tecla 'z' como curinga. O método Wubi foi projetado com esse recurso em mente; é por isso que nenhum componente é atribuído à tecla z. Basicamente, pode-se digitar az quando não tiver certeza de qual deve ser o componente, e o método de entrada ajudará a completá-lo. Se alguém souber, por exemplo, que o caractere deve começar com "kt", mas não tiver certeza de qual deve ser o próximo componente, digitar "ktz" produzirá uma lista de todos os caracteres que começam com "kt". Na prática, porém, muitos mecanismos de método de entrada usam um método de pesquisa tabular para todos os sistemas de entrada baseados em tabela, incluindo para Wubi. Isso significa que eles simplesmente possuem uma grande tabela na memória, associando diferentes personagens às suas respectivas representações. O método de entrada então se torna simplesmente uma pesquisa de tabela. Em tal implementação, a chave z quebra o paradigma e, como tal, não é encontrada em muitos softwares generalizados (embora o método de entrada Wubi comumente encontrado no Windows chinês implemente o recurso). Por este mesmo motivo, a otimização de múltiplos caracteres descrita no parágrafo anterior também é relativamente rara.

Alguns métodos de entrada, como xcin (encontrado em muitos sistemas semelhantes ao UNIX), fornecem uma funcionalidade genérica curinga que pode ser usada em todos os sistemas de entrada baseados em tabelas, incluindo pinyin e virtualmente qualquer outro. Xcin usa '*' para autocompletar e '?' por apenas uma letra, seguindo as convenções pioneiras no agrupamento de arquivos UNIX. Outras implementações provavelmente têm suas próprias convenções.

Subdivisão do teclado

O teclado Wubi assume um layout semelhante ao QWERTY , então os usuários de teclados que implementam um layout nacionalizado ou alternativo (como o Dvorak ou o AZERTY francês ) provavelmente terão que fazer alguns remapeamentos para tornar o sistema lógico. O Wubi não posiciona seus componentes arbitrariamente: há muitos deles, e é somente com a introdução de uma metodologia lógica que o sistema se torna fácil de aprender.

Basicamente, o teclado é dividido em 5 zonas, cada uma representando um toque. Esses cinco golpes estão caindo para a esquerda, caindo para a direita, horizontal, vertical e gancho, e as zonas que os representam são QWERT, YUIOP, ASDFG, HJKLM e XCVBN, respectivamente. Essas zonas são todas dispostas horizontalmente, com exceção de M, que não está alinhado com o resto das letras em sua zona.

De uma forma geral, o teclado pode ser pensado como dividido ao centro, entre T e Y, G e H, e N e M. As teclas em cada zona são numeradas afastando-se desta linha divisória: portanto, devemos realmente dizer que na zona QWERT, T é a primeira letra, R é a segunda e E a terceira; na zona YUIOP, Y é o primeiro, U é o segundo, I o terceiro, etc. Para XCVBN, N é o primeiro e assim por diante. Em HJKLM, considere M como o último da série, embora não esteja na linha.

Isso é importante porque os componentes da primeira posição terão uma repetição do golpe em questão (o golpe atribuído à zona a que pertencem), os da segunda, duas, os da terceira, três. Os componentes que não são facilmente classificáveis com este paradigma serão colocados na última letra.

Portanto, seria de se esperar que 一 estivesse localizado em G, e 二 em F e 三 em D e, de fato, este é o caso. Da mesma forma, seria de se esperar que 丨 estivesse localizado em H, 刂 em J e 川 em K. Esse padrão é válido para todas as zonas. Além disso, se estende à maioria dos radicais que parecem ser feitos de três dessas pinceladas, mesmo que na verdade nem sejam. Um exemplo disso é 中 em K: embora não tenha três traços para baixo (dois apenas), parece ter três. Além disso, é escrito à mão, primeiro escrevendo um radical de boca, 口, e depois dividindo-o ao meio com um traço vertical descendente. O radical de boca está em 'K', então isso torna a atribuição duplamente lógica. E a romanização pinyin de 口, kou3, começa com k, outro auxiliar de memória codificado no teclado Wubi.

Além disso, cada letra de cada zona tem um componente associado a ela, seu "componente principal". Geralmente, eles são um caractere completo (com exceção de X) por direito próprio. Sempre é possível digitar esse componente principal digitando a letra em que ele está localizado quatro vezes. Assim, por exemplo, o componente principal de H é 目, e assim seria digitado digitando "hhhh".

Cada letra também possui um caractere de atalho associado a ela. Em alguns casos, esse caractere é o mesmo que o componente associado à chave em questão, e às vezes não. Este caractere de atalho é o caractere produzido quando alguém digita apenas a letra e nada mais; todos esses são caracteres extremamente comuns usados ao digitar chinês.

É perfeitamente possível que haja vários componentes não listados abaixo, seja por descuido, porque eles raramente são usados ou porque não existe uma representação Unicode simples para o componente.

Zona QWERT (caindo à esquerda)

O principal componente da tecla Q é 金 e seu caractere de atalho é 我. Está associado aos seguintes componentes: 金, 钅, 勹, 儿, 夕, bem como o gancho no topo de 饣 e 角, o radical 犭sem o traço inferior descendente à esquerda (portanto, os caracteres com esse radical começam com " qt ", não apenas" q "), o cruzamento (como no centro de 区), o topo de 鱼 (ou seja, sem o traço horizontal na parte inferior) e os três (quase verticais)" pés " no canto inferior direito de 流.

O componente principal da tecla W e o caractere de atalho são ambos 人. Está associado aos seguintes componentes: 人, 亻, 八 e o topo de 癸. Embora 人 signifique homem, é frequentemente usado por Wubi para construir um radical de telhado, como em 会, "wfc". 入 não é governado por W, apesar de parecer semelhante, e enquanto 餐 tem um topo que se parece vagamente com o topo de 癸, os dois não são iguais (na verdade, para digitar 餐, é necessário digitar fisicamente cada componente no topo) .

O principal componente da tecla E é 月, e seu caractere de atalho é 有. Está associado aos seguintes componentes: 月, 用, 彡, 乃, a parte inferior de 衣 (ou seja, sem 亠), a parte superior de 孚 (ou seja, sem 子), 豕（porco), a parte inferior de 良 (ou seja, sem o 白), e a parte inferior de 舟 (ou seja, sem o pontinho no topo). Neste caso, o caractere de atalho de E nem mesmo começa com um traço descendente para a esquerda, mas apenas figura proeminentemente um componente pertencente a E. 彡 é apresentado neste caractere, pois é o terceiro caractere na zona (contando de T, consulte acima de). Uma distorção particular que surge frequentemente é o uso de E em 且 e em caracteres que o contenham: Wubi pensa neste componente como 月 + 一.

O principal componente da tecla R é 白, e seu caractere de atalho é 的. Está associado aos seguintes componentes: 白, 手, 扌, 斤 (ambos com e sem o T), 牛 ( sem o curso vertical descendente) e, claro, os dois movimentos descendentes para a esquerda 𰀪 que se esperaria do segundo na zona (veja a explicação acima). Cuidado com as variedades de 手 onde o gancho central para baixo é substituído por um golpe que cai para a esquerda, como em 看.

O principal componente da tecla T é 禾, e seu caractere de atalho é 和. Ele está associado aos seguintes componentes: 禾, 竹, 夂, 攵, 彳 e o topo de 乞 (ou seja, sem o 乙). 竹 também pode ser encontrado em sua forma menor (⺮). 丿 também é encontrado nesta chave, porque T é a primeira chave na zona (veja acima). Isso significa que se alguém estiver digitando um componente ou caractere traço por traço, eles (geralmente) usariam T para representar um traço que caia para a esquerda. Consulte a seção sobre golpes de desambiguação para obter mais informações sobre exceções a esta regra.

Zona YUIOP (caindo para a direita)

Esta zona também pode ser chamada de zona de pontos, porque seu padrão de Y: 讠 U: 冫 I: 氵 e O: 灬 não é necessariamente formado por golpes de queda para a direita. Na verdade, pode-se argumentar que o primeiro golpe em 灬 realmente cai para a esquerda . É chamada de zona de queda para a direita porque as teclas nesta zona, quando usadas para construir um caractere por traço (ao invés de componente), todas representam traços de queda para a direita para alguma configuração de caractere (consulte a seção sobre traços de desambiguação para mais informações).

O principal componente da tecla Y é 言 e seu caractere de atalho é 主. Está associado aos seguintes componentes: 言, 讠, 亠, 亠 com um 口 abaixo dele, 广, 文, 方 e 丶. Todos esses componentes começam com um golpe de queda para a direita. Geralmente, pontos em caracteres chineses são realmente deixou cair acidentes vasculares cerebrais, e por isso na maioria das vezes, o uso de T é mais apropriado do que Y. É claro que, se se pode escrever os caracteres chineses à mão, eles devem ser capazes de dizer que para escolher ao relembrar como está escrito.

O principal componente da tecla U é 立 e seu caractere de atalho é 产. Está associado aos seguintes componentes: 立, 六, 辛, 门, 疒, 丬, 冫, as "antenas" na parte superior de 单 (apenas dois traços: 丷), e as antenas mais um traço horizontal, conforme encontrado em o topo de 兹. A maioria deles apresenta dois traços diagonais curtos (门 sendo a exceção óbvia). Isso é consistente com a posição de U como a segunda letra na zona (veja uma explicação acima).

O principal componente da tecla I é 水, e seu caractere de atalho é 不. Está associado aos seguintes componentes: 水, 氵, 小, os três traços no topo de 学 e os três traços no topo de 当. Além disso, um componente que pode ser descrito como dois 冫, costas com costas, está associado a este caractere.

O principal componente da tecla O é 火, e seu caractere de atalho é 为. Está associado aos seguintes componentes: 火, 米, 灬 e 业sem o traço horizontal inferior - permite a construção de caracteres como 严. Esta é a quarta chave na zona de queda à direita: daí a inclusão de 灬.

O principal componente da tecla P é 之, e seu caractere de atalho é 这. Está associado aos seguintes componentes: 之, 辶, 廴, 冖, 宀 e 礻. Como os componentes Wubi são digitados na ordem em que precisariam ser escritos se um fosse escrito à mão, os componentes 辶 e 廴 são tipicamente digitados por último .

Zona ASDFG (horizontal)

O caractere de atalho da tecla A é 工.
O principal componente da tecla S é 木, e seu caractere de atalho é 要.
O principal componente da tecla D é 大, e seu caractere de atalho é 在.
O principal componente da tecla F é 土, e seu caractere de atalho é 地. O nome do componente principal (terra) corresponde ao caractere de atalho que significa terra.
O principal componente da tecla G é 王, e seu caractere de atalho é 一.

Zona HJKLM (vertical)

O principal componente da tecla H é 目, e seu caractere de atalho é 上.
O principal componente da tecla J é 日, e seu caractere de atalho é 是.
O principal componente da tecla K é 口 e seu caractere de atalho é 中.
O principal componente da tecla L é 田, e seu caractere de atalho é 国.
O principal componente da tecla M é 山 e seu caractere de atalho é 同.

Zona XCVBN (gancho)

O principal componente da tecla X é 纟, e seu caractere de atalho é 经.
O principal componente da tecla C é 又 e seu caractere de atalho é 以.
O principal componente da tecla V é 女, e seu caractere de atalho é 发.
O principal componente da tecla B é 子, e seu caractere de atalho é 了.
O principal componente da tecla N é 已, e seu caractere de atalho é 民.

Golpes de desambiguação

Os toques do teclado são divididos em 5 zonas

Zonas	Carta
1	GFDSA
2	HJKLM
3	TREWQ
4	YUIOP
5	NBVCX

Zonas	Golpe	Forma
1	一	Esquerda-Direita (Horizontal)
2	丨	Topo-Fundo (Vertical)
3	丿	Caindo para a esquerda
4	丶	Caindo certo
5	乙	Gancho

Exemplos

Personagens com 4 componentes ou menos (mas sem necessidade de traços)

Exemplo 1: 请 Consiste em três componentes: y (讠, radical # 10), g (王 *, radical 89), e (月, radical 118) -> 请

Personagens com mais de 4 componentes

Exemplo 2: 遗

Consiste em cinco componentes: k (口), h (丨), g (一), m (贝), p (辶) -> khgp -> 遗 (você não precisa digitar m)

Personagens com menos de 4 componentes (precisando de golpes)

Exemplo 3a: 文： Primeiro você digita a chave com o símbolo, que é 'Y'. Então você digita o primeiro componente, que também é 'Y' para o traço 点, então um 'G' para o traço 横， e como agora você já tem três traços, você digita o último toque, que também passa a ser um 捺, chegando ao código-chave 'YYGY' para o caractere completo.

Exemplo 3b: 一： O código para este caractere é 'GGLL'. Como antes, você digita a chave do caractere primeiro, que é 'G', depois o primeiro toque desse caractere, que também é um 'G'. Como todas essas informações são necessárias, o L é usado como preenchimento até chegar a 4 letras. Observe que o '一' também é o caractere de atalho para 'G' (tornando-o um toque apenas na prática).

Exemplo 3c: 广： O código para este personagem é 'YYGT'. Primeiramente, você digita a chave onde este caractere está localizado, que é um 'Y'. Em seguida, você digita um traço 点, que também está em 'Y'. O próximo será o traço 横 em 'G', e o último será o 捺, em 'T'.

Personagens que requerem golpes de desambiguação

Exemplo 4: 等

Consiste em três componentes: t (竹), f (土), f (寸),

Traços de desambiguação: o último traço é 丶 e o caractere é com estrutura de cima para baixo (42, u) -> 等

Poema

Foi feito um poema como mnemônico para o teclado Wubi, associando poucos caracteres a cada tecla. O primeiro caractere é o componente principal principal correspondente, enquanto os próximos são componentes ou caracteres associados.

Versão 1986

G11 王旁青头戋五一

F12 土士二干十寸雨

D13 大犬三羊古石厂

S14 木丁西

A15 工戈草头右框七

H21 目具上止卜虎皮

J22日早两竖与虫依

K23 口与川，字根稀

L24 田甲方框四车力

M25 山由贝, 下框几

T31 禾竹一撇双人立, 反文条头共三.

R32 白手看头三二斤

E33月彡（衫）乃用家衣底

W34 人和八，登祭头

Q35 金勺缺点无尾鱼, 犬旁留义儿一点夕, 氏无.

Y41 言文方广在四一, 高头一捺谁人去

U42 立辛两点六门疒（病）

I43 水旁兴头小倒立

O44 火业头，四点米

P45 之宝盖，摘示衣

N51 已半巳满不出己, 左框折尸心和.

B52 子耳了也框向上

V53 女刀九臼山朝西

C54 又巴马，丢矢矣

X55 慈母无心弓和匕, 幼无力

Versão de 1998

G11 王旁青头五夫一

F12 土干十寸未甘雨, 不要忘了革字底

D13 大犬戊其古石厂

S14 木丁西甫一四里

A15 工戈草头右框七

H21 目上卜止虎具头

J22 日早两竖与虫依

K23 口流川，码元稀

L24 田甲方框四车里

M25 山由贝骨下框集　

T31 禾竹反文双人立

R32 白斤气丘叉手提

E33 月用力豸毛衣臼

W34 人八登头单人几

Q35 金夕鸟儿犭边鱼

Y41 言文方点谁人去

U42 立辛六羊病门里

I43 水族三点鳖头小

O44 火业广鹿四点米

P45 之字宝盖补示衣

N51 已类左框心尸羽

B52 子耳了也乃框皮

V53 女刀九良山西倒

C54 又巴牛入马失蹄

X55 幺母贯头弓和匕

Versão do novo século (3ª geração)

G11 王旁青头五一提　

F12 土士二干十寸雨

D13 大三肆头古石厂　

S14 木丁西边要无女　

A15 工戈草头右框七

H21 目止具头卜虎皮　

J22 日曰两竖与虫依　

K23 口中两川三个竖

L24 田框四车甲单底　

M25 山由贝骨下框里

T31 禾竹牛旁卧人立　

R32 白斤气头叉手提　

E33 月舟衣力豕豸臼　

W34 人八登祭风头几　

Q35 金夕犭儿包头鱼

Y41 言文方点在四一　

U42 立带两点病门里　

I43 水边一族三点小　

O44 火变三态广二米　

P45 之字宝盖补示衣

N51 已类左框心尸羽　

B52 子耳了也乃齿底　

V53 女刀九巡录无水　

C54 又巴甬矣马失蹄　

X55 幺母绞丝弓三匕

Em média

Em 2020, a história de Wubi foi apresentada em um episódio do Radiolab intitulado "O Efeito Wubi".

Languages

In other projects

Método Wubi - Wubi method

Conteúdo

Como funciona

Detalhes específicos de implementação

Subdivisão do teclado

Zona QWERT (caindo à esquerda)

Zona YUIOP (caindo para a direita)

Zona ASDFG (horizontal)

Zona HJKLM (vertical)

Zona XCVBN (gancho)

Golpes de desambiguação

Exemplos

Personagens com 4 componentes ou menos (mas sem necessidade de traços)

Personagens com mais de 4 componentes

Personagens com menos de 4 componentes (precisando de golpes)

Personagens que requerem golpes de desambiguação

Poema

Versão 1986

Versão de 1998

Versão do novo século (3ª geração)

Em média

Notas e referências

links externos