Mapa de Choropleth - Choropleth map

Um mapa coroplético que visualiza a fração de australianos que se identificou como anglicana no censo de 2011. Os distritos selecionados são áreas do governo local , a variável é espacialmente intensiva (uma proporção) que não é classificada e um esquema de cores sequencial parcial espectral é usado.

Um mapa coroplético (do grego χῶρος choros 'área / região' e πλῆθος plethos 'multitude') é um tipo de mapa temático no qual um conjunto de áreas predefinidas é colorido ou padronizado em proporção a uma variável estatística que representa um resumo agregado de uma característica geográfica dentro de cada área, como densidade populacional ou renda per capita .

Os mapas coropléticos fornecem uma maneira fácil de visualizar como uma variável varia em uma área geográfica ou mostram o nível de variabilidade dentro de uma região. Um mapa de calor ou mapa isarítmico é semelhante, mas usa regiões desenhadas de acordo com o padrão da variável, ao invés de áreas geográficas a priori de mapas de coropletos. O Coroplet é provavelmente o tipo mais comum de mapa temático porque os dados estatísticos publicados (do governo ou outras fontes) são geralmente agregados em unidades geográficas bem conhecidas, como países, estados, províncias e condados e, portanto, são relativamente fáceis de crie usando GIS , planilhas ou outras ferramentas de software.

História

Mapa da alfabetização de Dupin de 1826 na França.

O primeiro mapa coroplético conhecido foi criado em 1826 pelo Barão Pierre Charles Dupin , descrevendo a disponibilidade de educação básica na França por departamento . Mais " cartes teintées " ("mapas coloridos") logo foram produzidos na França para visualizar outras "estatísticas morais" sobre educação, doença, crime e condições de vida. Os mapas coropléticos rapidamente ganharam popularidade em vários países devido à crescente disponibilidade de dados demográficos compilados dos Censos nacionais, começando com uma série de mapas coropléticos publicados nos relatórios oficiais do Censo de 1841 da Irlanda. Quando a cromolitografia se tornou amplamente disponível após 1850, a cor foi cada vez mais adicionada aos mapas coropléticos.

O termo "mapa coroplético" foi introduzido em 1938 pelo geógrafo John Kirtland Wright e era comum entre os cartógrafos na década de 1940. Também em 1938, Glenn Trewartha os reintroduziu como "mapas de proporção", mas esse termo não sobreviveu.

Estrutura

Um mapa coroplético reúne dois conjuntos de dados: dados espaciais que representam uma partição do espaço geográfico em distritos distintos e dados estatísticos que representam uma variável agregada dentro de cada distrito. Existem dois modelos conceituais comuns de como eles interagem em um mapa coroplético: em uma visualização, que pode ser chamada de "dominante distrital", os distritos (frequentemente unidades governamentais existentes) são o foco, nos quais uma variedade de atributos são coletados, incluindo a variável que está sendo mapeada. Na outra visão, que pode ser chamada de "variável dominante", o foco está na variável como um fenômeno geográfico (digamos, a população latina), com uma distribuição no mundo real, e a partição dela em distritos é meramente uma forma conveniente técnica de medição.

Neste mapa coroplético, os distritos são países, a variável é espacialmente intensiva (uma distribuição média) com uma classificação de progressão geométrica modificada e um esquema de cores divergentes espectrais é usado.

Geometria: distritos de agregação

Em um mapa coroplético, os distritos são geralmente entidades previamente definidas, como unidades governamentais ou administrativas (por exemplo, condados, províncias, países) ou distritos criados especificamente para agregação estatística (por exemplo, setores censitários ) e, portanto, não têm expectativa de correlação com a geografia da variável. Ou seja, os limites dos distritos de cor podem ou não coincidir com a localização das mudanças na distribuição geográfica em estudo. Isto está em contraste direto com chorochromatic e isarithmic mapas, em que região fronteiras são definidas por padrões na distribuição geográfica do fenômeno assunto.

Usar regiões de agregação predefinidas tem uma série de vantagens, incluindo: compilação e mapeamento mais fácil da variável (especialmente na era do GIS e da Internet com suas muitas fontes de dados), reconhecimento dos distritos e aplicabilidade das informações para mais pesquisas e políticas vinculadas a cada distrito. Um bom exemplo disso seriam as eleições, nas quais o total de votos de cada distrito determina seu representante eleito.

No entanto, pode resultar em uma série de problemas, geralmente devido ao fato de que a cor constante aplicada a cada distrito de agregação faz com que pareça homogêneo, mascarando um grau desconhecido de variação da variável dentro do distrito. Por exemplo, uma cidade pode incluir bairros de renda familiar baixa, moderada e alta, mas ser colorida com uma cor constante "moderada". Assim, os padrões do mundo real podem não estar de acordo com a unidade regional simbolizada. Por causa disso, questões como a falácia ecológica e o problema da unidade de área modificável (MAUP) podem levar a grandes interpretações errôneas dos dados descritos, e outras técnicas são preferíveis se for possível obter os dados necessários.

Esses problemas podem ser atenuados de alguma forma usando distritos menores, porque eles mostram variações mais sutis na variável mapeada, e seu tamanho visual menor e número aumentado reduzem a probabilidade de que o usuário do mapa faça julgamentos sobre a variação dentro de um único distrito. No entanto, eles podem tornar o mapa muito complexo, especialmente se não houver um padrão geográfico significativo na variável (ou seja, o mapa parece com cores espalhadas aleatoriamente). Embora representar dados específicos em grandes regiões possa ser enganoso, as formas familiares dos distritos podem tornar o mapa mais claro e fácil de interpretar e lembrar. A escolha das regiões dependerá, em última instância, do público-alvo pretendido e do propósito do mapa. Alternativamente, a técnica dasimétrica às vezes pode ser empregada para refinar os limites da região para corresponder mais de perto às mudanças reais no fenômeno em questão.

Por causa dessas questões, para muitas variáveis, pode-se preferir um mapa isarítmico (para uma variável quantitativa) ou corocromático (para uma variável qualitativa), em que os limites da região são baseados nos próprios dados. No entanto, em muitos casos, essas informações detalhadas simplesmente não estão disponíveis, e o mapa coroplético é a única opção viável.

Um mapa coroplético no qual os distritos são condados dos EUA, a variável é espacialmente intensiva (uma proporção) com uma classificação de quantil e usa um esquema de cores sequencial de tom único.

Propriedade: resumos estatísticos agregados

A variável a ser mapeada pode vir de uma ampla variedade de disciplinas no mundo humano ou natural, embora tópicos humanos (por exemplo, demografia, economia, agricultura) sejam geralmente mais comuns por causa do papel das unidades governamentais na atividade humana, o que muitas vezes leva a a coleta original dos dados estatísticos. A variável também pode estar em qualquer um dos níveis de medição de Stevens : nominal, ordinal, intervalo ou razão, embora as variáveis quantitativas (intervalo / razão) sejam mais comumente usadas em mapas coropléticos do que variáveis qualitativas (nominais / ordinais). É importante notar que o nível de medição do dado individual pode ser diferente da estatística de resumo agregado. Por exemplo, um censo pode pedir a cada indivíduo sua "língua falada principal" (nominal), mas isso pode ser resumido para todos os indivíduos em um condado como "porcentagem que fala principalmente espanhol" (proporção) ou como "principal predominante idioma "(nominal).

De um modo geral, um mapa coroplético pode representar dois tipos de variáveis, uma distinção comum à física e à química , bem como à geoestatística e análise espacial :

Uma variável espacialmente extensa (às vezes chamada de propriedade global ) é aquela que pode ser aplicada apenas a todo o distrito, comumente na forma de contagens totais ou quantidades de um fenômeno (semelhante à massa ou peso na física). Diz-se que variáveis extensas são cumulativas no espaço; por exemplo, se a população do Reino Unido é de 65 milhões, não é possível que as populações da Inglaterra, País de Gales, Escócia e Irlanda do Norte também possam ser 65 milhões. Em vez disso, suas populações totais devem somar (acumular) para calcular a população total da entidade coletiva. No entanto, embora seja possível mapear uma variável extensa em um mapa coroplético, isso é quase universalmente desencorajado porque os padrões podem ser facilmente mal interpretados. Por exemplo, se um mapa coroplético atribuísse um tom específico de vermelho a populações totais entre 60 e 70 milhões, uma situação em que o Reino Unido (como um único distrito) tem 65 milhões de habitantes seria indistinguível de uma situação em que os quatro países constituintes cada um tinha 65 milhões de habitantes, embora essas sejam realidades geográficas muito diferentes. Outra fonte de erro de interpretação é que se um distrito grande e um distrito pequeno tiverem o mesmo valor (e, portanto, a mesma cor), o maior terá naturalmente a aparência de mais. Outros tipos de mapas temáticos , especialmente símbolos proporcionais e cartogramas , são projetados para representar variáveis extensas e geralmente são preferidos.
Uma variável espacialmente intensiva , também conhecida como campo , superfície estatística ou variável localizada , representa uma propriedade que pode ser medida em qualquer local (um ponto ou pequena área, dependendo de sua natureza) no espaço, independente de quaisquer fronteiras, embora seja a variação em um distrito pode ser resumida como um único valor. As variáveis intensivas comuns incluem densidades, proporções, taxas de mudança, distribuições médias (por exemplo, PIB per capita) e estatísticas descritivas (por exemplo, média, mediana, desvio padrão). As variáveis intensivas são ditas distributivas no espaço; por exemplo, se a densidade populacional do Reino Unido é de 250 pessoas por quilômetro quadrado, então seria razoável estimar (na ausência de quaisquer outros dados) que a densidade mais provável (se não realmente correta) de cada um dos cinco países constituintes também é 250 / km ² . Tradicionalmente na cartografia, o modelo conceitual predominante para esse tipo de fenômeno tem sido a superfície estatística , em que a variável é imaginada como uma "altura" de terceira dimensão acima do espaço bidimensional que varia continuamente. Na ciência da informação geográfica , a conceituação mais comum é o campo , adotada da Física e geralmente modelada como uma função escalar de localização. Os mapas coropléticos são mais adequados para variáveis intensivas do que extensas; se um usuário do mapa vir o Reino Unido preenchido com uma cor para "100-200 pessoas por km quadrado", estimar que o País de Gales e a Inglaterra podem ter cada um 100-200 pessoas por km quadrado pode não ser preciso, mas é possível e razoável estimativa.

Normalização: o mapa à esquerda usa a população total para determinar a cor. Isso faz com que os polígonos maiores pareçam ser mais urbanizados do que as áreas urbanas menores e densas de Boston , Massachusetts. O mapa à direita usa a densidade populacional. Um mapa normalizado corretamente mostrará variáveis independentes do tamanho dos polígonos.

Normalização

Normalização é a técnica de derivar uma variável espacialmente intensiva de uma ou mais variáveis espacialmente extensas, de modo que possa ser usada apropriadamente em um mapa coroplético. É semelhante, mas não idêntica, à técnica de normalização ou padronização em estatística. Normalmente, isso é realizado calculando a razão entre duas variáveis espacialmente extensas. Embora qualquer uma dessas proporções resulte em uma variável intensiva, apenas algumas são especialmente significativas e comumente usadas em mapas coropléticos:

Densidade = total / área. Exemplo: densidade populacional
Proporção = total do subgrupo / total geral. Exemplo: famílias ricas como uma porcentagem de todas as famílias.
Alocação média = quantidade total / total de indivíduos. Exemplo: produto interno bruto per capita (PIB total / população total)
Taxa de mudança = total no momento posterior / total no momento anterior. Exemplo: taxa de crescimento anual da população.

Estes não são equivalentes, nem um é melhor do que o outro. Em vez disso, eles contam diferentes aspectos de uma narrativa geográfica. Por exemplo, um mapa coroplético da densidade populacional da população latina no Texas visualiza uma narrativa sobre o agrupamento e distribuição espacial desse grupo, enquanto um mapa da porcentagem latina visualiza uma narrativa de composição e predominância.

Classificação

Este mapa das eleições presidenciais dos Estados Unidos de 2004-2016 usa distritos de condado, uma variável espacialmente intensiva (diferença na proporção) que não é classificada e uma progressão de cor espectral divergente. Observe a legenda de gradiente contínuo que reflete a falta de classificação.

Cada mapa coroplético tem uma estratégia para mapear valores para cores. Um mapa coroplético classificado separa o intervalo de valores em classes, com todos os distritos em cada classe sendo atribuídos à mesma cor. Um unclassed mapa (às vezes chamado n-class ) atribui directamente uma cor proporcional ao valor de cada distrito. Começando com o mapa de Dupin de 1826, os mapas coropléticos classificados têm sido muito mais comuns. É provável que originalmente isso se devesse à maior simplicidade de aplicação de um conjunto limitado de tonalidades; apenas na era da cartografia computadorizada os mapas coropléticos não classificados se tornaram viáveis e, até recentemente, eles ainda não eram fáceis de criar na maioria dos softwares de mapeamento. Waldo R. Tobler , ao apresentar formalmente o esquema não classificado em 1973, afirmou que era uma descrição mais precisa dos dados originais e afirmou que o principal argumento a favor da classificação, que é mais legível, precisava ser testado. O debate e os experimentos que se seguiram chegaram à conclusão geral de que a principal vantagem dos mapas coropléticos não classificados, além da afirmação de Tobler de precisão bruta, era que eles permitiam aos leitores ver variações sutis na variável, sem levá-los a acreditar que os distritos os caíram na mesma classe tinham valores idênticos. Assim, eles são capazes de ver melhor os padrões gerais do fenômeno geográfico, mas não os valores específicos. O principal argumento a favor dos mapas coropléticos classificados é que é mais fácil para os leitores processar, devido ao menor número de tons distintos para reconhecer, o que reduz a carga cognitiva e permite que eles correspondam precisamente as cores no mapa aos valores listados em a lenda.

A classificação é realizada estabelecendo uma regra de classificação , uma série de limites que particiona o intervalo quantitativo de valores de variáveis em uma série de classes ordenadas. Por exemplo, se um conjunto de dados de renda média anual por condado dos EUA inclui valores entre US $ 20.000 e US $ 150.000, ele pode ser dividido em três classes com limites de US $ 45.000 e $ 83.000. Para evitar confusão, qualquer regra de classificação deve ser mutuamente exclusiva e coletivamente exaustiva , o que significa que qualquer valor possível cai em exatamente uma classe. Por exemplo, se uma regra estabelece um limite no valor de 6,5, deve ficar claro se um distrito com um valor de exatamente 6,5 será classificado na classe inferior ou superior (ou seja, se a definição da classe inferior é < 6,5 ou ≤6,5 e se a classe superior é> 6,5 ou ≥6,5). Uma variedade de tipos de regras de classificação foram desenvolvidas para mapas coropléticos:

Regras exógenas
importam limites sem levar em conta os padrões nos dados em mãos.
- As regras
estabelecidas são aquelas já em uso comum devido a pesquisas científicas anteriores ou políticas oficiais. Um exemplo seria o uso de faixas de impostos do governo ou um limite de pobreza padrão ao classificar os níveis de renda.
Estratégias ad hoc ou de senso comum são essencialmente inventadas pelo cartógrafo usando limites que têm algum senso intuitivo. Um exemplo seria classificar as rendas de acordo com o que o cartógrafo acredita ser "rico", "classe média" e "pobre". Essas estratégias geralmente não são recomendadas, a menos que todos os outros métodos não sejam viáveis.

As regras endógenas são baseadas em padrões no próprio conjunto de dados.

As regras de

quebras naturais procuram agrupamentos naturais nos dados, nos quais um grande número de distritos têm valores semelhantes com grandes lacunas entre eles. Se for esse o caso, esses clusters provavelmente são geograficamente significativos.

A otimização de quebras naturais de Jenks é um algoritmo heurístico para identificar automaticamente tais clusters, caso existam; é essencialmente uma forma unidimensional do algoritmo de agrupamento k-means . Se os clusters naturais não existirem, as quebras que ele gera são frequentemente reconhecidas como um bom meio-termo entre os outros métodos e é comumente o classificador padrão usado no software GIS.

Intervalos iguais ou uma progressão aritmética divide o intervalo de valores para que cada classe tenha um intervalo igual de valores: ( máx - mín ) / n . Por exemplo, a faixa de renda acima ($ 20.000 - $ 150.000) seria dividida em quatro classes em $ 52.500, $ 85.000 e $ 117.500.

Uma regra de desvio padrão também gera intervalos iguais de valor, mas em vez de começar com os valores mínimo e máximo, ela começa na média aritmética dos dados e estabelece uma quebra em cada múltiplo de um número constante de desvios padrão acima e abaixo da média .

Quantiles divide o conjunto de dados para que cada classe tenha um número igual de distritos. Por exemplo, se os 3.141 condados dos Estados Unidos fossem divididos em quatro classes de quantis (ou seja, quartis ), a primeira classe incluiria os 785 condados mais pobres e os próximos 785. Pode ser necessário fazer ajustes quando o número de distritos não divide uniformemente ou quando valores idênticos ultrapassam o limite.

Uma regra de progressão geométrica divide o intervalo de valores para que a proporção dos limiares seja constante (em vez de seu intervalo, como em uma progressão aritmética). Por exemplo, a faixa de renda acima seria dividida usando uma proporção de 2 com limites de $ 40.000 e $ 80.000. Esse tipo de regra é comumente usado quando a distribuição de frequência dos dados tem uma inclinação positiva muito alta , especialmente se for geométrica ou exponencial .

Uma média aninhada ou regra de quebra de cabeça / cauda é um algoritmo que divide recursivamente o conjunto de dados, definindo um limite na média aritmética e , em seguida, subdividindo cada uma das duas classes criadas em suas respectivas médias e assim por diante. Assim, o número de classes não é arbitrário, mas deve ser uma potência de dois (2, 4, 8, etc.). Foi sugerido que isso também funciona bem para distribuições altamente distorcidas .

Como os limites calculados geralmente podem estar em valores precisos que não são facilmente interpretáveis pelos leitores de mapa (por exemplo, US $ 74.326,9734), é comum criar uma regra de classificação modificada arredondando os valores de limite para um número simples semelhante. Um exemplo comum é uma progressão geométrica modificada que subdivide potências de dez, como [1, 2,5, 5, 10, 25, 50, 100, ...] ou [1, 3, 10, 30, 100, ... ]

Progressão de cor

O elemento final de um mapa coroplético é o conjunto de cores usado para representar os diferentes valores da variável. Há uma variedade de abordagens diferentes para esta tarefa, mas o princípio principal é que qualquer ordem na variável (por exemplo, valores quantitativos baixos a altos) deve ser refletida na ordem percebida das cores (por exemplo, claro a escuro), como isso permitirá que os leitores de mapas façam julgamentos "mais versus menos" intuitivamente e vejam tendências e padrões com o mínimo de referência à legenda. Uma segunda diretriz geral, pelo menos para mapas classificados, é que as cores devem ser facilmente distinguíveis, de forma que as cores no mapa possam ser correspondidas de forma inequívoca com as da legenda para determinar os valores representados. Esse requisito limita o número de classes que podem ser incluídas; para tons de cinza, os testes mostraram que quando o valor sozinho é usado (por exemplo, claro a escuro, seja cinza ou qualquer matiz único ), é difícil usar praticamente mais de sete classes. Se as diferenças de matiz e / ou saturação forem incorporadas, esse limite aumenta significativamente para até 10-12 classes. A necessidade de discriminação de cores é ainda mais impactada por deficiências na visão de cores ; por exemplo, esquemas de cores que usam vermelho e verde para distinguir valores não serão úteis para uma parte significativa da população .

Os tipos mais comuns de progressões de cores usados em mapas coropléticos (e outros temáticos) incluem:

Uma progressão sequencial representa valores variáveis como valor de cor
- Uma progressão da escala de cinza usa apenas tons de cinza.
  
  Progressão da escala de cinza
- Uma progressão de tom único desvanece de um tom escuro da cor escolhida (ou cinza) para um tom muito claro ou branco de relativamente o mesmo tom. Este é um método comum usado para mapear a magnitude. O matiz mais escuro representa o maior número no conjunto de dados e o matiz mais claro representa o menor número.
  
  Progressão de tonalidade única
- Uma progressão espectral parcial usa uma gama limitada de matizes para adicionar mais contraste ao contraste do valor, permitindo que um número maior de classes seja usado. O amarelo é comumente usado para o final mais claro da progressão devido à sua leveza aparente natural. Os intervalos de matiz comuns são amarelo-verde-azul e amarelo-laranja-vermelho.
  
  Progressão espectral parcial
Uma progressão Divergente ou Bipolar é essencialmente duas progressões de cores sequenciais (dos tipos acima) unidas por uma cor de luz comum ou branco. Normalmente são usados para representar valores positivos e negativos ou divergência de uma tendência central, como a média da variável que está sendo mapeada. Por exemplo, uma progressão típica ao mapear temperaturas é de azul escuro (para frio) a vermelho escuro (para quente) com branco no meio. Eles são freqüentemente usados quando os dois extremos recebem julgamentos de valor, como mostrar o lado "bom" como verde e o lado "ruim" como vermelho.

Progressão de cor bipolar
Uma progressão espectral usa uma ampla gama de matizes (possivelmente a roda de cores inteira) sem diferenças pretendidas de valor. Isso é mais comumente usado quando há uma ordem para os valores, mas não é uma ordem "mais vs. menos", como sazonalidade. É frequentemente usado por não cartógrafos em situações em que outras progressões de cores seriam muito mais eficazes.

Progressão de cor totalmente espectral
Uma progressão qualitativa usa um conjunto disperso de matizes em nenhuma ordem particular, sem nenhuma diferença pretendida no valor. Isso é mais comumente usado com categorias nominais em um mapa coroplético qualitativo, como "religião mais prevalente".

Progressão de cor qualitativa

Mapas bivariados de coropletos

Mapa coroplético bivariado comparando as populações negra (azul) e hispânica (vermelha) nos Estados Unidos, censo de 2010; tons de roxo mostram proporções significativas de ambos os grupos.

É possível representar duas (e às vezes três) variáveis simultaneamente em um único mapa coroplético, representando cada uma com uma progressão de tom único e combinando as cores de cada distrito. Essa técnica foi publicada pela primeira vez pelo US Census Bureau na década de 1970 e tem sido usada muitas vezes desde então, com vários graus de sucesso. Essa técnica geralmente é usada para visualizar a correlação e o contraste entre duas variáveis que se supõe estarem intimamente relacionadas, como nível de escolaridade e renda. Geralmente, usam-se cores contrastantes, mas não complementares, de modo que sua combinação é intuitivamente reconhecida como "entre" as duas cores originais, como vermelho + azul = roxo. A técnica funciona melhor quando a geografia da variável tem um alto grau de autocorrelação espacial , de modo que existem grandes regiões de cores semelhantes com mudanças graduais entre elas; caso contrário, o mapa pode parecer uma mistura confusa de cores aleatórias. Descobriu-se que eles são mais facilmente usados se o mapa incluir uma legenda cuidadosamente projetada e uma explicação da técnica.

Lenda

Um mapa coroplético usa símbolos ad hoc para representar a variável mapeada. Embora a estratégia geral possa ser intuitiva se for escolhida uma progressão de cor que reflita a ordem apropriada, os leitores de mapa não podem decifrar o valor real de cada distrito sem uma legenda. Uma lenda coroplética típica para um mapa coroplético classificado inclui uma série de amostras de manchas do símbolo para cada classe, com uma descrição de texto do intervalo de valores correspondente. Em um mapa coroplético não classificado, é comum que a legenda mostre um gradiente de cor suave entre os valores mínimo e máximo, com dois ou mais pontos ao longo dele rotulados com os valores correspondentes.

Uma abordagem alternativa é a legenda do histograma , que inclui um histograma que mostra a distribuição de frequência da variável mapeada (ou seja, o número de distritos em cada classe). Cada classe pode ser representada por uma única barra com sua largura determinada por seus valores de limite mínimo e máximo e sua altura calculada de forma que a área da caixa seja proporcional ao número de distritos incluídos, então colorida com o símbolo do mapa usado para aquela classe. Alternativamente, o histograma pode ser dividido em um grande número de barras, de modo que cada classe inclua uma ou mais barras, simbolizadas de acordo com seu símbolo no mapa. Esta forma de legenda mostra não apenas os valores de limite para cada classe, mas fornece algum contexto para a origem desses valores, especialmente para regras de classificação endógena que são baseadas na distribuição de frequência, como quantis. No entanto, eles não são atualmente suportados no GIS e software de mapeamento e, normalmente, devem ser construídos manualmente.

Veja também

Cartogramas , que geralmente são coloridos como coropletos.
Mapa de calor
MacChoro

Notas de rodapé

Referências

Dent, Borden; Torguson, Jeffrey; Hodler, Thomas (21 de agosto de 2008). Projeto Cartografia Temática de Mapas . McGraw-Hill. ISBN 978-0-072-94382-5.

Languages

In other projects