🧶 - Modelos de Visão & Oportunidade de Aceleração
Hey pessoal, sou eu de novo.
Dessa vez trazendo poucas mas consistentes atualizações.
👁️ Modelos de visão
Um usuário trouxe na comunidade um problema no modelo de geração de texto que usamos, ele não é capaz de interpretar emojis.
Não vou afirmar que sei o porquê, mas entendo que modelos menores possuem limitações na capacidade de armazenar e representar informações complexas devido ao número reduzido de parâmetros. Isso pode levar à incapacidade de aprender nuances associadas a emojis.
Frustrado com essa limitação, decidi adicionar modelos de visão computacional, que não vão ser capazes de interpretar o emoji como unicode mas são plenamente capazes de interpreta-los como imagem.
São eles:
- image-text to text
- Similar ao GPT, Gemini e outros, esses modelos tem a capacidade de raciocinar sobre um conjunto de imagens e textos.
- Modelo: llava-hf/llava-onevision-qwen2-0.5b-ov-hf
- image classification
- Esses modelos são capazes de identificar elementos em uma imagem e retornam uma pontuação de 0 a 1 refletindo a precisão de cada elemento identificado.
- Modelo: google/vit-base-patch16-224
- Zero-Shot image classification
- Esses modelos classificam imagens baseado em palavras-chave e retornam a pontuação de 0 a 1 para cada palavra-chave.
- Modelo: openai/clip-vit-base-patch16
Assim, o que era um gap (interpretar imagens) se tornou provavelmente o que temos de mais legal para oferecer.
Obrigado ice
<3
Melhorias menores
-
Modelo de sumarização adicionado
-
Primeira tarefa de multimidia inclusa: char-to-image
-
A ideia é possibilitar facilmente a transformação de emojis em imagens, porém ainda está bem inicial então, você não sabe qual sistema operacional ou navegador vai executar a tarefa, assim o emoji pode vir sempre como uma imagem diferente
-
-
Especificamos o preço de cada serviço (quem processa ganha 50% de qualquer tarefa) reforçando a política de preços: 90% mais barato que o concorrente mais barato
-
Página de processar modelos agora mostra se o usuário está conectado e permite desativar/ativar o recebimento de tarefas.
-
Programa Linhas vai contemplar bug bounty e acesso antecipado a funcionalidades: https://woolball.xyz/Early
Aceleradora de Startups
Não me considero uma pessoa emocionada ou iludida mas isso aqui encheu meu tanque de motivação.
Após feedbacks positivos de colegas e da comunidade TabNews, decidi aplicar o projeto para participar do programa de aceleração da WOW Aceleradora de Startups
Até sem lembrar desse fato continuei investindo energia sem dó, até que esses dias o e-mail chegou
Fico feliz em dizer que o seu projeto foi aprovado para a segunda fase do nosso 30º processo de seleção!
Tenho chances reais de receber um aporte e ser uma startup acelerada?!
Eu diria que são chances baixas, tenho pouco conhecimento de empreendedorismo e sei que o perfil dos fundadores é tão ou mais importante que o produto em si.
Além disso, é de comum acordo (segundo meus estudos) que empreender sozinho é um ponto extremamente negativo.
O que é a segunda fase? uma entrevista 🥶
E como dev sei que entrevista e rejeição são vizinhas.
Porém como humano sei que só não é rejeitado quem não tenta, então vamos pra cima.
Agora estou focando em divulgar o produto e detalhar a proposta de valor em torno dele
Ajuda ai
Galera sei que é chato quando ficam pedindo ajuda, principalmente quando se trata de um produto surgindo, feio, de um zé ninguem e cheio de falhas.
Então vou listar aqui como você pode ajudar, partindo da ação mais simples à mais complexa.
- Dando upvote nessa publicação
- Comentando como podemos melhorar
- Curtir artigos que publiquei no linkedin:
- Upvote no Product Hunt
- Entrando na lista de espera do programa Linhas
- Participando da comunidade no discord
- Processando modelos de IA pelo navegador
- Usando a API
- Relatando problemas de qualquer natureza
- Mandando pix ;D zoeira
É isso, obrigado por ter lido e com certeza depois da entrevista eu trago todas as novidades, boas ou ruins, pra vocês
Um abraço!