Executando verificação de segurança...
2

HTML lang=pt-?

Outro dia, ao criar um projeto novo em ASP.NET, notei que a inspeção dinâmica do ReSharper da IDE Rider não me sugeriu o uso do sufixo de país BR para o atributo lang do HTML.

Me perguntei se isso deixou de ser padrão (ou nunca foi).

TL;DR;

Consegue me dar um exemplo onde o não uso do pt-BR no atributo lang do HTML pode causar algum problema ou mal entendimento? Se sim, me diga qual para que eu possa investigar e sanar minha dúvida, no que tange a padronização de uso.

O que diz a documentação

A definição na W3C existe e é bem clara quanto a sua estrutura:

lang = primary-code ( "-" subcode )

Onde:

  • primary-code (prefixo): o idioma português (pt)
  • subcode (sufixo): o idioma português usado na região geográfica do Brasil (BR)

O prefixo (obrigatório) está padronizado na ISO639 desde 1988 e foi revisto em 2002. Já o sufixo (opcional) está padronizado na ISO3166 desde 1981, mas foi revisto em 1988, 1993, 1997, 2006, 2007, 2013 e até o momento, 2020.

Usando a ferramenta BCP47 language subtag lookup, pesquisei por BR e o resultado foi:

Breton
type: language
subtag: br
description: Breton
added: 2005-10-16

Brazil
type: region
subtag: BR
description: Brazil
added: 2005-10-16n

Aparece como tipo de idioma (Bretão) e tipo de região (Brasil). Se eu requisitar a validação do conjunto pt-BR, recebo um OK com ressalva:

OK! The language tag pt-BR is well-formed and the subtags are valid IANA subtags, however, you should check the comments related to usage below.

Check that the region subtag BR contributes information needed to distinguish this language tag from another one, otherwise leave it out.

For example, en-GB can be useful for spell-checking, but the region subtag in ja-JP is unlikely to be useful unless you are intentionally contrasting it with Japanese spoken in other parts of the world.

Justo. Aviso pertinente. Me alertou a usar o BR desde que eu certifique que isso contribui para a distinção das variações linguísticas (quando as diferenças culturais afetam ou dificultam o entendimento do texto, como gírias, vícios de linguagens, etc...). Não importa se você mora no Ceará ou Rio Grande do Sul. Falamos português. Gíria não é idioma.

Considerando que o Português é o idioma oficial em nove países, manter o BR parece ser o "correto" a se fazer.

Isolando o perímetro

Vamos fechar o escopo e analisar dois desses países: Portugal e Brasil. Segundo a Korn, empresa especializada em traduções:

Oficialmente, não existe distinção entre português de Portugal e português do Brasil, ou seja, o português é reconhecido como um único idioma, não sendo considerado, no Brasil, em Portugal ou em outro país em que é nativo, como idioma estrangeiro.

Desconsidere variações gramaticais e gírias, pois até entre estados do Brasil algumas são inteligíveis. E mesmo que algumas soem diferente, o entendimento do português é possível, pois boa parte pode ser encontrado como sinônimo (embora provençal e rococó algumas vezes), como é o caso de Peúgas (Meias), Casa de Banho (Banheiro), Castanho (Marrom), Chávena (Xícara) ou Autocarro (Ônibus).

Mesmo palavras que pareçam falsos cognatos, como Geladeira (Frigorífico), estas podem ser compreendidas se estiver no contexto correto, afinal, palavra isolada dá ruim em qualquer lugar. Veja por exemplo:

Ponto

  • de ônibus?
  • de ortografia?
  • de ferimento?
  • de jogo?

Se eu levar para o inglês e lhe dar um contexto, serão palavras diferentes. Mas se eu não especificar, não tem como saber a quê estou me referindo. Sem contexto, complica.

Mas voltando para o português do Brasil e Portugal, nem mesmo o Google Tradutor considera haver distinção. Só há o português. Se digitar "autocarro" ele te devolve "ônibus" como sinônimo possível.

E então?

Tudo parece conspirar para que eu pare de usar o BR, a não ser que seja estritamente necessário, como ocorre com o Chinês, onde a variação do dialeto não é compreensível em todas as regiões do país.

Achei uma pergunta sobre o assunto no FAQ da W3C que me levou para o site do Internet Assigned Numbers Authority (IANA), o mesmo sugerido pela ferramenta BCP47 language subtag lookup que usei ali em cima.

Verificando o catálogo oficial de sufixos, encontrei:

Type: varian
Subtag: abl1943
Description: Orthographic formulation of 1943 - Official in Brazil
  (Formulário Ortográfico de 1943 - Oficial no Brasil)
Added: 2015-05-06
Prefix: pt-BR
Comments: Denotes conventions established by the Academia Brasileira de
  Letras in 1943 and generally used in Brazil until 2009

O registro foi criado em 2015, reconhecendo o sufixo BR como variação ortográfica do português no Brasil, que contemplava o período de 1943 à 2009!

Porém...

Type: varian
Subtag: ao1990
Description: Portuguese Language Orthographic Agreement of 1990 (Acordo
  Ortográfico da Língua Portuguesa de 1990)
Added: 2015-05-06
Prefix: pt
Prefix: gl
Comments: Portuguese orthography conventions established in 1990 but
  not brought into effect until 2009

Após assinatura da reforma ortográfica em 1990, a mudança não ocorreu em cima do sufixo BR e sim no prefixo, afetando somente o PT: o português na sua forma ampla, pura e cristalina, oras pois, desconsiderando qualquer variação cultural, já que não temos dialetos relacionados (idioma indígena não conta neste caso. Aliás, a título de curiosidade, existem códigos para eles na tabela do IANA).

Pergunto

Tudo isso me levou a crer que oficialmente, usar BR no atributo lang do HTML não é oficial. É algo defasado; opcional; não relevante; não distinguível; não recomendado; ignorado; não considerado; obsoleto ou seja lá o que for.

O que você acha sobre o assunto? Consegue me dar um exemplo onde o não uso do pt-BR no atributo lang do HTML pode causar algum problema ou mal entendimento? Se sim, me diga qual para que eu possa investigar e sanar minha dúvida, no que tange a padronização de uso.

Pois na real, estou tentado a parar de usá-lo.

Carregando publicação patrocinada...
2

Fala Raphael! Tudo bem?
O uso do pt-BR é muito importante para definir o idioma "falado" por leitores de tela e tecnologias assistivas que geram leitura e voz.
Se não utilizar o "BR" gerará um mal entendimento por parte de pessoas que utilizam estas tecnologias. Por isso, é fundamental o uso dela.

1

Olá, Eduardo.

Eu considerei esses leitores de tela, mas não os citei na minha questão para não induzir na resposta. Mas já que tu trouxe o assunto, pode me dizer uma ferramenta onde isso é um problema (ou uma palavra que causaria confusão)? Pois a princípio, usando o Google Translate (que narra conteúdo, seja textual ou por scan de tela), não percebi nenhum mal entendimento. Inclusive, a ferramenta nem lhe dá a opção de distinção. É só português.

Eu queria algo concreto que realmente seja um problema, pois conforme relatei acima, nem empresas de tradução consideram haver variações (inclusive judicial). Português não tem dialeto. É o mesmo nos nove países em que é oficial.

Note que o acordo ortográfico foi feito em cima de PT. O BR está lá parado, desde 2009! Achei estranho algo ser abandonado quando deveria ser considerado fundamental.

Logo, qualquer reader de tela atual, ao receber a instrução pt-BR, irá fazê-lo errado, em cima de um português pré acordo ortográfico, de 2009, não considerando nenhuma das mudanças vigentes.

1