HTML semântico - Semantic HTML

HTML semântico é o uso da marcação HTML para reforçar a semântica , ou significado, das informações em páginas da web e aplicativos da web, em vez de simplesmente definir sua apresentação ou aparência . O HTML semântico é processado por navegadores da web tradicionais , bem como por muitos outros agentes de usuário . CSS é usado para sugerir sua apresentação para usuários humanos.

História

HTML incluiu marcação semântica desde o seu início. Em um documento HTML, o autor pode, entre outras coisas, "começar com um título; adicionar cabeçalhos e parágrafos; dar ênfase ao [o] texto; adicionar imagens; adicionar links para outras páginas; [e] usar vários tipos de listas" .

Várias versões do padrão HTML incluíram marcação de apresentação , como <font>(adicionado no HTML 3.2; removido no HTML 4.0 Strict), <i>(todas as versões) e <center>(adicionado no HTML 3.2). Existem também os elementos span e div semanticamente neutros . Desde o final da década de 1990, quando o Cascading Style Sheets estava começando a funcionar na maioria dos navegadores, os autores da web foram incentivados a evitar o uso de marcação HTML de apresentação com o objetivo de separar a apresentação do conteúdo .

Em 2001, Tim Berners-Lee participou de uma discussão sobre a Web Semântica , onde foi apresentado que "agentes" de software inteligente podem um dia rastrear automaticamente a Web e encontrar, filtrar e correlacionar fatos publicados anteriormente não relacionados para o benefício dos usuários finais . Esses agentes não são comuns até agora, mas algumas das ideias da Web 2.0 , mashups e sites de comparação de preços podem estar chegando perto. A principal diferença entre esses híbridos de aplicativos da web e os agentes semânticos de Berners-Lee reside no fato de que a agregação e hibridização atuais de informações geralmente são projetadas por desenvolvedores da web, que já conhecem os locais da web e a semântica da API dos dados específicos que desejam para misturar, comparar e combinar.

Um tipo importante de agente da web que rastreia e lê páginas da web automaticamente, sem conhecimento prévio do que pode encontrar, é o rastreador da web ou o spider do mecanismo de pesquisa. Esses agentes de software dependem da clareza semântica das páginas da web que encontram, pois usam várias técnicas e algoritmos para ler e indexar milhões de páginas da web por dia e fornecer aos usuários da web recursos de pesquisa .

Para que os spiders do mecanismo de pesquisa possam avaliar a importância dos trechos de texto que encontram em documentos HTML, e também para aqueles que criam mashups e outros híbridos, bem como para agentes mais automatizados à medida que são desenvolvidos, as estruturas semânticas que existentes em HTML precisam ser amplamente e uniformemente aplicados para trazer à tona o significado das informações publicadas.

Embora a verdadeira web semântica possa depender de ontologias e metadados RDF complexos , todo documento HTML dá sua contribuição para o significado da web pelo uso correto de cabeçalhos, listas, títulos e outras marcações semânticas sempre que possível. Esse uso "simples" de HTML foi chamado de "HTML semântico antigo simples" ou POSH. O uso correto da 'marcação' da Web 2.0 cria folksonomias que podem ser igualmente ou até mais significativas para muitos. HTML 5 introduziu novos elementos semânticos, tais como , , , , , , , e . No geral, o objetivo do W3C é introduzir lentamente mais maneiras para navegadores, desenvolvedores e rastreadores distinguirem melhor entre diferentes tipos de dados, permitindo benefícios como melhor exibição em navegadores em dispositivos diferentes. sectionarticlefooterprogressnavasidemarktime

Os elementos de apresentação não foram formalmente descontinuados nas recomendações do HTML 4.01 e do XHTML, mas não foram recomendados. No HTML 5, alguns desses elementos, como ie bainda são especificados, já que seu significado foi claramente definido "para serem estilisticamente deslocados da prosa normal sem transmitir qualquer importância extra".

Considerações

Nos casos em que um documento requer uma semântica mais precisa do que aquelas expressas apenas em HTML, fragmentos do documento podem ser incluídos dentro de spanou divelementos com nomes de classe significativos, como <span class="author">e <div class="invoice">. Onde esses nomes de classe também são um identificador de fragmento dentro de um esquema ou ontologia, eles podem se vincular a um significado mais definido. Os microformatos formalizam essa abordagem à semântica em HTML.

Uma restrição importante dessa abordagem é que essa marcação com base na inclusão de elemento deve atender às condições de boa formação. Como esses documentos são amplamente estruturados em árvore, isso significa que apenas fragmentos balanceados de uma subárvore podem ser marcados dessa maneira. Um meio de marcar qualquer seção arbitrária de HTML exigiria um mecanismo independente da própria estrutura de marcação, como o XPointer .

Um bom HTML semântico também melhora a acessibilidade de documentos da web (consulte também Diretrizes de acessibilidade de conteúdo da web ). Por exemplo, quando um leitor de tela ou navegador de áudio pode determinar corretamente a estrutura de um documento, ele não desperdiçará o tempo do usuário com deficiência visual lendo informações repetidas ou irrelevantes quando tiverem sido marcadas corretamente.


"Rich snippets" do Google

Em 2010, o Google especificou três formas de metadados estruturados que seus sistemas usarão para encontrar conteúdo semântico estruturado em páginas da web. Essas informações, quando relacionadas a comentários, perfis de pessoas, listagens de empresas e eventos, serão usadas pelo Google para aprimorar o "snippet" ou um pequeno trecho de texto citado que é mostrado quando a página aparece nas listagens de pesquisa. O Google especifica que esses dados podem ser fornecidos usando microdados , microformatos ou RDFa . Os microdados são especificados dentro itemtypee os itempropatributos são adicionados aos elementos HTML existentes; palavras-chave de microformato são adicionadas aos classatributos conforme discutido acima; e RDFa depende rel, typeofe propertyatributos adicionados a elementos existentes.

Veja também

Referências

adasdas

links externos