Executando verificação de segurança...
21

Criei um Bot no discord para organizar minhas aulas na faculdade

Já faz um tempo que eu tenho percebido que minha galeria está lotada de fotos de aulas que eu tenho na faculdade, e depois quando eu preciso estudar sobre alguma matéria eu acabo me pedendo em meio a tanta fotos que eu possuo, foi então que eu tive uma ideia de automatizar esse processo usando alguma IA para identificar as fotos e organizar em "pastas" por matéria.

Todo o processo foi bem simples de fazer, mas foi muito bom poder criar um bot no discord e usar IA para poder ler imagens

O projeto ficará open source e quem quiser pode contribuir e usar também.

Repo no github: https://github.com/vitorGabr/study-bot-ia

2
2
1

Então não sofri muito porque já tinha uma noção básica de como funcionava, a única parte que demorei mais para fazer é transformar a imagem que vem do discord em base64 para o modelo de IA conseguir ler, fora isso foi de boa

2
2
1

Ficou genial o resultado. Se possível, explica melhor como foi o processo de concepção e algumas dificuldades, pois ficou show e possivelmente foi árduo o trabalho.

1

Sabe, a ideia toda começou com a intenção de usar o Google Drive pra organizar as fotos. No começo, nem passava pela minha cabeça usar IA, era só isso mesmo. Mas aí, quando fui tentar mexer no SDK do Google Drive tive muita dor de cabeça com a autenticação! Daí, surgiu um estalo: 'E se a gente usar o Discord?' E pô, foi uma sacada genial, porque o Discord é muito bom e facil de mexer

Aí, quando tive a ideia de usar IA pra ler as imagens, dei de cara com a API do Google Gemini, que tem esse modelo Vision, e a melhor parte: de grátis! Deu certinho, consegui testar sem stress com custo e tudo mais. Depois, expandi pro Anthropic com o teste de 5 dolares, mas está aberto a usar qualquer modelo de IA.

1
1

Como ele funciona? Você envia a imagem em um chat do Discord, o bot usa AI pra interpretar a imagem e reenvia ela ao chat do tema respectivo com a descrição do que teve na aula?

1

Sim, eu mando todo dia apos a aula e envio todas as mingens que eu tirei no dia anterior, ai ele interpreta as imagens falando de quais matérias são e reenvia para o canal da materia especifica fazendo um resumo sobre o conteudo passado na aula, e coloca em anexo as imagens identificadas daquela materia.

1

Eu estava olhando lá no github fiquei curioso em relação a qual foi a arquitetura de código que você usou. Se você não se importar em explicar, me interessaria saber mais sobre como você dividiu o projeto qual é a função de cada módulo de código.

1