Problema da Ordem Definida Pelo Usuário
Introdução
Você já se deparou com o seguinte problema?
Você tem uma lista de conteúdos, e o usuário pode alterar a ordem dessa lista à vontade. Além disso, essa ordem precisa ser mantida para o usuário na próxima vez que ele acessar a lista.
Esse problema, que à primeira vista parece simples, esconde uma complexidade considerável. O desafio principal é como realizar essas mudanças de forma eficiente, minimizando o número de alterações no banco de dados.
Neste post quero explorar algumas soluções para esse problema usando SQL e PostgreSQL.
Modelagens
Simples
Uma abordagem inicial seria modelar a lista usando uma coluna inteira chamada position
, que determina a posição de cada item na lista.
CREATE TABLE card (
id SERIAL PRIMARY KEY,
content TEXT NOT NULL,
position INTEGER UNIQUE NOT NULL
);
A inserção de elementos nessa estrutura é bastante simples:
INSERT INTO card (content)
VALUES ('content1'),
('content2'),
('content3'),
('content4');
SELECT * FROM card ORDER BY position ASC;
id | content | position |
---|---|---|
1 | content1 | 1 |
2 | content2 | 2 |
3 | content3 | 3 |
4 | content4 | 4 |
Isso nos dá uma lista ordenada pelos valores de position
.
No entanto, a dificuldade surge quando o usuário decide reordenar os itens. Suponha que o usuário deseje mover o item com position = 3
para a primeira posição. Com essa modelagem, você precisaria:
- Atualizar o item movido para
position = 1
- Incrementar a posição de todos os outros itens que foram deslocados.
UPDATE card
SET position = position + 1
WHERE position >= 1 AND position < 3;
UPDATE card
SET position = 1
WHERE content = 'content3';
Esse processo envolve múltiplas operações de atualização, o que pode ser ineficiente, especialmente em listas longas.
Posição Decimal
Agora, e se trocássemos o INTEGER
por FLOAT
para trabalhar com valores decimais? Isso permitiria inserir novos elementos na lista calculando a média entre duas posições (position = (i+j)/2
), facilitando a reordenação sem precisar atualizar todas as posições subsequentes.
CREATE TABLE card (
id SERIAL PRIMARY KEY,
content TEXT NOT NULL,
position FLOAT UNIQUE NOT NULL
);
INSERT INTO card (content, position)
VALUES ('content1', 1.0),
('content2', 2.0),
('content3', 3.0),
('content4', 4.0);
Se for necessário mover o conteúdo 3 para a primeira posição, basta aplicar a média:
UPDATE card
SET position = (0 + 1.0)/2
WHERE content = 'content3';
A princípio, essa parece uma solução eficiente. No entanto, números de ponto flutuante têm uma precisão limitada, o que pode gerar problemas com mudanças sucessivas ao longo do tempo, causando erros de arredondamento e perda de precisão.
Frações Verdadeiras
Tanto a solução usando INTEGER
quanto FLOAT
têm limitações significativas, especialmente no manejo de posições médias e atualizações consecutivas. Uma abordagem alternativa e mais robusta seria o uso de frações verdadeiras.
Embora o PostgreSQL
não ofereça suporte nativo para frações, a extensão pg_rational
, criada por begriffs
, permite trabalhar com números racionais. Esta extensão converte valores decimais em frações verdadeiras, evitando problemas de precisão. O código pode ser encontrado no GitHub.
A ideia é que as frações não negativas podem ser representadas como uma árvore binária, especificamente a Árvore de Stern–Brocot. Esta árvore permite encontrar frações dentro de limites definidos até atingir o nó desejado, proporcionando uma forma eficiente de reordenar elementos.
Esse método foi um dos melhores que encontrei para manipular a ordem dos itens em listas, mas por não ser uma funcionalidade padrão do PostgreSQL
, pode limitar seu uso. No entanto, para quem busca uma solução avançada, vale a pena explorar. Recomendo a leitura da publicação do autor sobre esse método: User-defined Order in SQL.
Árvore Binária
Por fim, uma solução interessante que utiliza uma variação da Árvore de Stern–Brocot, mas implementada de forma nativa no PostgreSQL
, é o uso de uma árvore binária de bits. Esta abordagem se baseia em representar posições na lista como sequências binárias, permitindo a inserção de novos elementos entre dois valores adjacentes sem precisar reajustar todas as posições subsequentes.
A estrutura da árvore binária pode ser visualizada da seguinte forma:
_____ 1 ____
______/ \______
_ 01 _ 11
_/ \_ _/ \_
001 011 101 111
/ \ / \ / \ / \
0001 0011 0101 0111 1001 1011 1101 1111
No PostgreSQL
, isso pode ser feito utilizando o tipo VARBIT
, que permite a representação e manipulação de cadeias binárias variáveis. A ideia é gerar um novo VARBIT
entre dois valores adjacentes para criar a nova posição.
CREATE TABLE card (
id SERIAL PRIMARY KEY,
content TEXT NOT NULL,
position VARBIT UNIQUE
);
A função adj
é responsável por criar uma nova posição ao ajustar a sequência de bits:
CREATE FUNCTION adj(orig VARBIT, b VARBIT) RETURNS VARBIT LANGUAGE SQL AS $$
SELECT substring(orig FOR LENGTH(orig)-1)
||b
||substring(orig FROM LENGTH(orig));
$$;
Já a função f
define a lógica para determinar a nova posição entre dois valores adjacentes, considerando os casos em que um dos valores é NULL
ou quando as sequências binárias têm comprimentos diferentes:
CREATE FUNCTION f(l VARBIT, h VARBIT) RETURNS VARBIT LANGUAGE plpgsql as $$
BEGIN
IF l IS NULL AND h IS NULL THEN RETURN B'1'; END IF;
IF l IS NULL THEN RETURN adj(h,B'0'); END IF;
IF h IS NULL THEN RETURN adj(l,B'1'); END IF;
IF LENGTH(l)>LENGTH(h) THEN RETURN adj(l,B'1'); END IF;
RETURN adj(h,B'0');
END;
$$;
Com isso, dado o meu exemplo anterior.
INSERT INTO card (content, position)
VALUES ('content1', B'001'),
('content2', B'011'),
('content3', B'101'),
('content4', B'111');
SELECT * FROM card ORDER BY POSITION;
id | content | position |
---|---|---|
1 | content1 | 001 |
2 | content2 | 011 |
3 | content3 | 101 |
4 | content4 | 111 |
Agora, se eu quero colocar o 3 na primeira posição, basta fazer a troca:
UPDATE card
SET position = f(null, B'001') -- entre null e 1
WHERE content = 'content3';
update card
set position = f(B'101', B'111') -- entre 3 e 4
where content = 'content1';
SELECT * FROM card ORDER BY POSITION;
id | content | position |
---|---|---|
3 | content3 | 0001 |
2 | content2 | 011 |
1 | content1 | 1101 |
4 | content4 | 111 |
O pior cenário dessa abordagem ocorre quando a lista é inicialmente carregada com muitas linhas já ordenadas. Isso pode levar a um problema de espaço, já que cada nova inserção exigirá um bit adicional na coluna position
para acomodar a posição do novo item. Com o tempo, à medida que a lista cresce e mais posições intermediárias são inseridas, a position
pode se tornar significativamente longa, consumindo mais espaço de armazenamento e potencialmente impactando o desempenho.
Conclusão
Neste post, exploramos várias abordagens interessantes para a ordenação de listas definida pelo usuário no banco de dados, começando por soluções simples e avançando para métodos mais sofisticados encontrados na literatura e na prática.
Sinseramente, a escolha da abordagem mais adequada depende das necessidades específicas do seu projeto. No entanto, espero que essa discussão tenha ajudado a esclarecer as diferentes opções disponíveis e como elas podem ser aplicadas para resolver problemas desse tipo de ordenação de forma eficiente.