Executando verificação de segurança...
1

Inteligência Artificial: Do Workshop de Dartmouth à Revolução dos GPTs

O Nascimento da Inteligência Artificial

A Inteligência Artificial, surgiu como campo de pesquisa no Workshop de Dartmouth em 1956. Durante este evento histórico, um grupo de cientistas visionários, incluindo John McCarthy, Marvin Minsky, Nathaniel Rochester e Claude Shannon, propuseram que "todos os aspectos da aprendizagem ou qualquer outra característica da inteligência podem, em princípio, ser descritos de forma tão precisa que uma máquina pode ser feita para simulá-los".

Isto torna a Inteligência Artificial um dos únicos campos de pesquisa com uma certidão de nascimento ofical e um dos mais abgragentes em escposo.

Os primeiros resultados positivos em Inteligência Artificial foram notáveis e geraram um otimismo considerável. No início dos anos 60, programas de IA já eram capazes de resolver problemas de álgebra simbólica, provar teoremas geométricos e aprender a falar inglês. Em 1965, o programa de IA chamado ELIZA, criado por Joseph Weizenbaum no MIT, foi capaz de simular uma conversa humana tão convincentemente que muitos usuários acreditavam estar interagindo com um humano, na epoca assim como o ChatGPT foi um grande hype.

O Inverno da IA

O otimismo inicial logo deu lugar a uma realidade mais dura. A complexidade dos problemas aumentou e as técnicas de IA da época não conseguiram acompanhar. A falta de progresso levou a uma redução no financiamento e interesse pela IA, período conhecido como "inverno da IA", e se se iniciou aproximadamente inicio do anos 70.

Na virada do milênio, a IA ressurgiu com força total, impulsionada por avanços em aprendizado de máquina, aumento da capacidade de processamento dos computadores e a disponibilidade de grandes volumes de dados digitais. Este período, muitas vezes referido como o "verão da IA", viu o surgimento de sistemas de IA que superaram humanos em tarefas complexas.

A Era do Aprendizado de Máquina

Aprendizado de máquina (ML) é um subcampo da Inteligência Artificial que se concentra no desenvolvimento de algoritmos que permitem aos computadores aprender a partir e fazer previsões ou decisões baseadas em dados passados.

Deep Learning, por outro lado, é uma subcategoria do ML que se concentra em redes neurais com diversas camadas. Essas redes neurais tentam simular o comportamento do cérebro animal para 'aprender' a reagir a estimulos. Aplicações práticas do Deep Learning incluem reconhecimento de imagem e voz sendo a base para tecnologias como carros autônomos e assistentes virtuais como a Siri e a Alexa.

A última tendência são os Transformadores Generativos Pré-treinados, como o ChatGPT e o DALL-E, que representam uma evolução recente no campo do Deep Learning. Eles são extremamente úteis e competentes em diversas áreas que envolvem compressão e geração de texto e imagens.

Os Ciclos de Hype na IA

No entanto, é importante lembrar que a IA tem um histórico de ciclos de hype. A promessa inicial da IA nos anos 60 e 70 deu lugar ao "inverno da IA" quando a tecnologia não conseguiu cumprir as expectativas. Embora as tecnologias de IA atuais, sejam certamente impressionantes e tenham um potencial enorme, devemos ser cautelosos para não superestimar suas capacidades.

As tecnologias baseadas em aprendizado de máquina, como as redes neurais profundas, são muitas vezes estocásticas por natureza. Isso significa que elas incorporam um elemento de aleatoriedade em seu funcionamento. Este processo pode levar a resultados diferentes cada vez que o sistema é executado, mesmo com os mesmos dados de entrada. Isso cria seério problemas de confiabilidade e reprodutibilidade, que são áreas de pesquisa ativa no campo da IA.

O Caminho para a dominar IA

Finalmente, é importante notar que saber como usar ferramentas de Deep Learning para treinar modelos, ou escrever prompts para o ChatGPT, não faz de você um especialista em IA. A compreensão da história e dos princípios fundamentais da IA é essencial para um verdadeiro entendimento do campo. A IA é uma disciplina complexa que requer uma compreensão profunda de uma variedade de tópicos, incluindo matemática, ciência da computação, estatística e até mesmo filosofia, psicologia e neurociência.

Para aqueles que desejam dominar a IA, é essencial uma compreensão profunda desses e de outros desafios fundamentais do campo. Brincar com ferramentas prontas pode ser um bom ponto de partida, mas para realmente entender a IA, é necessário um estudo sério e aprofundado. O livro "Artificial Intelligence: A Modern Approach" é uma excelente fonte de conhecimento, abrangendo desde os fundamentos históricos até os desenvolvimentos mais recentes no campo. Portanto, se você está realmente interessado em dominar a IA, sugiro que leia este livro no café da manhã, no almoço e no jantar.

Carregando publicação patrocinada...
2

Conforme ela vai ficando mais humana, ela também comete mais erros e faz mais deduções errôneas.
Eu estava pedindo bastante para o ChatGPT fazer coisas simples como concatenar uma longa cadeia de SQL para depois inserir no software, mas tive que parar de usar pois não é confiável, uma das vezes ela simplesmente adicionou um "not" na instrução SQL, foi um erro difícil de encontrar pois a instrução funcionava e eu não desconfiava que o SQL foi mexido.

1

Na verdade, esse é um problema geral dos modelos de linguagem grandes como a família GPT. Queremos utilizá-los como bases de conhecimento, o que não é a finalidade principal deles. Apesar de conseguirem capturar contexto em muitos casos e de gerarem textos coesos, eles podem gerar respostas totalmente incoerentes ou mesmo inventarem absurdos no processo de alucinação. Acho que não encontramos o real propósito desses modelos ainda.

1

Achei o texto interessante, porém creio que há uma pequena incorreção quando você fala que as redes neurais tentam simular o comportamento do cérebro animal. Na verdade, seu componente fundamental, o neurônio artificial, funciona como uma simplificação absurda do comportamento de um neurônio natural, funcionando mais como uma analogia, mesmo que ainda muito poderosa. Apesar dessa inspiração inicial na neurociência, não é objetivo do aprendizado profundo simular redes de neurônios naturais. Tal tarefa está mais inclinada para o campo de neurociência computacional. Inclusive, o aprendizado profundo não se limita a neurociência apenas, sofrendo influência de diversas outras áreas.

Outro ponto é sobre a recomendação do livro. Acredito que ele seja um livro muito teórico para quem está começando no campo, apesar de essencial para se tornar um especialista de fato.

1

Oi Lucas, primeiramente muito obrigado por seus comentários!

Sobre a questão do neurônio artifial e o cérebro animal.

Receptive fields of single neurones in the cat's striate cortex

O trabalho de Hubel e Wiesel foi tão revolucionário que lhes rendeu o Prêmio Nobel de Medicina em 1981. Em termos de redes neurais artificias, os conceitos introduzidos por Hubel e Wiesel inspiraram muitos dos princípios fundamentais por trás das arquiteturas de redes neurais. A ideia geral de neurônios respondendo a características específicas e hierárquicas que é a base de tudo e qualquer deep learning foram influenciadas pela compreensão do processamento de informações no cérebro, exatamente como destacado pelo trabalho de Hubel e Wiesel.

Portanto, mesmo que as redes neurais artificiais sejam simplificações e não repliquem a complexidade completa do cérebro assim como outras arquiteturas não tentaram imitar este comportamento, as ideias centrais são influenciadas pela neurociência e os estudos de Hubel e Wiesel.

Sobre o livro.

Entendo seus sentimentos em relação ao "Modern Artificial Intelligence". Sim, é uma obra densa e exigirá anos para ser completamente dominada. Não é o tipo de livro que você simplesmente estuda uma vez da primeira à última página. Minha sugestão inicial é começar pela introdução para entender o escopo e a estrutura da obra. Familiarize-se bem com o índice; ele será seu guia ao longo do tempo. Se algum tópico chamar sua atenção, mergulhe nele. Quando estiver trabalhando ou estudando algo e lembrar que viu algo relacionado no índice, consulte-o.
Trata-se de um livro de referência para uma longa jornada de aprendizado em inteligência artificial e não apenas para curtas aventuras.

Um abraço e bons estudos!

1

Sim, concordo que a influência da neurociência no desenvolvimento do campo de aprendizado profundo é inegável. Inclusive, muitos termos da neurociência são utilizados até hoje. Por exemplo, o próprio campo receptivo estudado por Hubel e Wiesel é empregado no contexto das redes neurais convolucionais para descrever a região de ativiação dos neurônios em uma imagem. Além disso, a arquitetura de redes neurais convolucionais pode ser considerada como uma evolução da Neocognitron que foi fortemente inspirada no sistema visual de mamíferos.

No entanto, como Goodfellow e Bengio colocam no capítulo de introdução do livro Deep Learning, não devemos ver o aprendizado profundo como uma tentativa de simular o cérebro, até mesmo por não conhecermos tão bem os mecanismos da aprendizagem biológica. Inclusive, o processo de aprendizagem das redes neurais artificias possui desafios técnicos próprios que foram e são contornados com o auxílio de outras áreas que não a neurociência. Por exemplo, o algoritmo de otimização do gradiente estocástico descendente e a inicialização dos parâmetros do modelo são tópicos de matemática aplicada.

Parece implicância minha, mas é só uma discussão que pode até ser pouco relevante de fato. Quanto ao livro, gostei da sua recomendação. Infelizmente, ainda tenho uma percepção muito imediatista dos estudos. Preciso aprender que algumas obras demandam um longo tempo para serem dissecadas e apreciadas. Inclusive, muitas partes da obra podem ser relidas com uma outra percepção com o passar do tempo. Então, nunca realizamos uma única leitura.

Obrigado e outro abraço também.

1

De maneira alguma a discução que você trouxe é relevante sim, e você está absulutamente correto, a abordagem no post original foi sim rasa e simplista, obrigado por trazer este ponto a tona!

Sua perpecção sobre a leitura destas obras está também correta, adicionaria somente que, não apenas podem ser relidas, como de fato devem ser!