HTML lang=pt-?
Outro dia, ao criar um projeto novo em ASP.NET, notei que a inspeção dinâmica do ReSharper da IDE Rider não me sugeriu o uso do sufixo de país BR
para o atributo lang
do HTML
.
Me perguntei se isso deixou de ser padrão (ou nunca foi).
TL;DR;
Consegue me dar um exemplo onde o não uso do pt-BR
no atributo lang
do HTML
pode causar algum problema ou mal entendimento? Se sim, me diga qual para que eu possa investigar e sanar minha dúvida, no que tange a padronização de uso.
O que diz a documentação
A definição na W3C existe e é bem clara quanto a sua estrutura:
lang = primary-code ( "-" subcode )
Onde:
- primary-code (prefixo): o idioma português (pt)
- subcode (sufixo): o idioma português usado na região geográfica do Brasil (BR)
O prefixo (obrigatório) está padronizado na ISO639 desde 1988 e foi revisto em 2002. Já o sufixo (opcional) está padronizado na ISO3166 desde 1981, mas foi revisto em 1988, 1993, 1997, 2006, 2007, 2013 e até o momento, 2020.
Usando a ferramenta BCP47 language subtag lookup, pesquisei por BR
e o resultado foi:
Breton
type: language
subtag: br
description: Breton
added: 2005-10-16
Brazil
type: region
subtag: BR
description: Brazil
added: 2005-10-16n
Aparece como tipo de idioma (Bretão) e tipo de região (Brasil). Se eu requisitar a validação do conjunto pt-BR
, recebo um OK com ressalva:
OK! The language tag pt-BR is well-formed and the subtags are valid IANA subtags, however, you should check the comments related to usage below.
Check that the region subtag BR contributes information needed to distinguish this language tag from another one, otherwise leave it out.
For example, en-GB can be useful for spell-checking, but the region subtag in ja-JP is unlikely to be useful unless you are intentionally contrasting it with Japanese spoken in other parts of the world.
Justo. Aviso pertinente. Me alertou a usar o BR
desde que eu certifique que isso contribui para a distinção das variações linguísticas (quando as diferenças culturais afetam ou dificultam o entendimento do texto, como gírias, vícios de linguagens, etc...). Não importa se você mora no Ceará ou Rio Grande do Sul. Falamos português. Gíria não é idioma.
Considerando que o Português é o idioma oficial em nove países, manter o BR
parece ser o "correto" a se fazer.
Isolando o perímetro
Vamos fechar o escopo e analisar dois desses países: Portugal e Brasil. Segundo a Korn, empresa especializada em traduções:
Oficialmente, não existe distinção entre português de Portugal e português do Brasil, ou seja, o português é reconhecido como um único idioma, não sendo considerado, no Brasil, em Portugal ou em outro país em que é nativo, como idioma estrangeiro.
Desconsidere variações gramaticais e gírias, pois até entre estados do Brasil algumas são inteligíveis. E mesmo que algumas soem diferente, o entendimento do português é possível, pois boa parte pode ser encontrado como sinônimo (embora provençal e rococó algumas vezes), como é o caso de Peúgas (Meias), Casa de Banho (Banheiro), Castanho (Marrom), Chávena (Xícara) ou Autocarro (Ônibus).
Mesmo palavras que pareçam falsos cognatos, como Geladeira (Frigorífico), estas podem ser compreendidas se estiver no contexto correto, afinal, palavra isolada dá ruim em qualquer lugar. Veja por exemplo:
Ponto
- de ônibus?
- de ortografia?
- de ferimento?
- de jogo?
Se eu levar para o inglês e lhe dar um contexto, serão palavras diferentes. Mas se eu não especificar, não tem como saber a quê estou me referindo. Sem contexto, complica.
Mas voltando para o português do Brasil e Portugal, nem mesmo o Google Tradutor considera haver distinção. Só há o português. Se digitar "autocarro" ele te devolve "ônibus" como sinônimo possível.
E então?
Tudo parece conspirar para que eu pare de usar o BR
, a não ser que seja estritamente necessário, como ocorre com o Chinês, onde a variação do dialeto não é compreensível em todas as regiões do país.
Achei uma pergunta sobre o assunto no FAQ da W3C que me levou para o site do Internet Assigned Numbers Authority (IANA), o mesmo sugerido pela ferramenta BCP47 language subtag lookup que usei ali em cima.
Verificando o catálogo oficial de sufixos, encontrei:
Type: varian
Subtag: abl1943
Description: Orthographic formulation of 1943 - Official in Brazil
(Formulário Ortográfico de 1943 - Oficial no Brasil)
Added: 2015-05-06
Prefix: pt-BR
Comments: Denotes conventions established by the Academia Brasileira de
Letras in 1943 and generally used in Brazil until 2009
O registro foi criado em 2015, reconhecendo o sufixo BR
como variação ortográfica do português no Brasil, que contemplava o período de 1943 à 2009!
Porém...
Type: varian
Subtag: ao1990
Description: Portuguese Language Orthographic Agreement of 1990 (Acordo
Ortográfico da Língua Portuguesa de 1990)
Added: 2015-05-06
Prefix: pt
Prefix: gl
Comments: Portuguese orthography conventions established in 1990 but
not brought into effect until 2009
Após assinatura da reforma ortográfica em 1990, a mudança não ocorreu em cima do sufixo BR
e sim no prefixo, afetando somente o PT
: o português na sua forma ampla, pura e cristalina, oras pois, desconsiderando qualquer variação cultural, já que não temos dialetos relacionados (idioma indígena não conta neste caso. Aliás, a título de curiosidade, existem códigos para eles na tabela do IANA).
Pergunto
Tudo isso me levou a crer que oficialmente, usar BR
no atributo lang
do HTML
não é oficial. É algo defasado; opcional; não relevante; não distinguível; não recomendado; ignorado; não considerado; obsoleto ou seja lá o que for.
O que você acha sobre o assunto? Consegue me dar um exemplo onde o não uso do pt-BR
no atributo lang
do HTML
pode causar algum problema ou mal entendimento? Se sim, me diga qual para que eu possa investigar e sanar minha dúvida, no que tange a padronização de uso.
Pois na real, estou tentado a parar de usá-lo.