Como a inteligência artificial está criando coisas que não existem?

Um ramo da inteligência artificial está ganhando forças com as aplicações dos últimos anos. A inteligência artificial generativa é um área da inteligência artificial que tende a criar coisas que não existiam antes apenas observando padrões, desde rostos até obras de arte.

Inteligência artificial cria coisas novas?
Tem ocorrido uma explosão de aplicações de inteligência artificial que utiliza uma área chamada inteligência artificial generativa.

Recentemente, estamos vendo o sucesso do ChatGPT que consegue gerar desde textos explicativos até mesmo roteiros de filmes. Também vemos o StableDiffusion que é um modelo capaz de gerar imagens e vídeos extremamente realistas.

A ideia de uma inteligência artificial criando coisas novas não é nova. Modelos que são capazes de gerar frases já vem desde os anos 90 com o advento dos chatbots. O próprio corretor automático de celulares são exemplos de inteligência artificial generativa.

A inteligência artificial generativa é um exemplo de modelos que geram coisas novas a partir de observações de um conjunto de dados. Elas aprendem ao observar uma série de dados, como imagens ou textos, e através de técnicas de probabilidade, elas aprendem a criar novos dados.

Exemplos de redes neurais generativas

O exemplo mais recente e que tem chamado muita atenção é o ChatGPT. O ChatGPT é um modelo de linguagem natural que utiliza técnicas de aprendizado de máquina para conseguir gerar textos após uma entrada de texto. Abaixo um texto gerado pelo ChatGPT com a entrada de texto: Descreva a história da música All Too Well da Taylor Swift.

A música é conhecida por ser uma das faixas mais pessoais e emocionais de Swift, e é amplamente considerada uma das melhores músicas de sua carreira. A história por trás de "All Too Well" remonta a um relacionamento de curta duração que Swift teve com o ator britânico Jake Gyllenhaal em 2010.

Outro exemplo são as imagens geradas pelo DALL-E 2 que consegue criar imagens a partir de uma entrada de texto. Abaixo exemplos de gerações da DALL-E 2.

Imagens geradas pelo DALL-E
Imagens geradas pelo DALL-E 2. Na primeira imagem, o input que gerou a imagem é "gato vestido de astronauta olhando para a Terra no estilo do estúdio Ghibli". A segunda imagem foi gerada com "planeta Júpiter com um rosto de gato na sua superfície". Crédito: DALL-E 2

Esses são alguns exemplos de aplicações de inteligência artificial generativa. Elas criam algo após aprender usando observações de padrões que a priori não existia.


De acordo com Swift, a letra da música é baseada em uma experiência pessoal em que ela se apaixonou profundamente por alguém, mas o relacionamento acabou de forma abrupta e dolorosa. A música retrata o sentimento de perda e arrependimento que Swift sentiu após o fim do relacionamento, e os versos detalhados e emotivos têm sido amplamente interpretados como uma expressão de suas próprias emoções na época.

Machine learning: aprendendo através de observações

O aprendizado de máquina, ou machine learning, é uma técnica que consiste em alimentar dados para um algoritmo. Esse algoritmo vai fitando uma função após encontrar padrões naquele conjunto de dados. Um exemplo é que você pode alimentar uma série de pinturas de Van Gogh, o algoritmo irá fitar uma função capaz de entender o estilo de Van Gogh.

Há diferentes formas de aprendizado de máquina mas uma delas chamam a atenção: o aprendizado supervisionado.

O aprendizado supervisionado consiste em você dar conjunto de dados e a resposta do que você quer que o modelo retorne.

Imagina que você dê várias imagens de cachorros para um algoritmo aprender a reconhecer um cachorro junto com a classificação “cachorro” ou imagens de gatos com classificação “gato”. Em resumo, você dá ao algoritmo a resposta que você quer e ele aprende observando esses conjuntos.

Outra forma são os aprendizados não-supervisionados que deixa para que o modelo consiga aprender sozinho após observar vários dados.

Como uma inteligência artificial generativa funciona?

A inteligência artificial generativa é um exemplo de aprendizado de máquina. Ela recebe um conjunto de dados e consegue reproduzir após observar e aprender os padrões.

As redes neurais generativas (GANs) são redes neurais criadas com a intenção de gerar coisas novas. Elas funcionam da seguinte forma: há duas redes com uma chamada geradora e uma chamada discriminadora. A geradora tem o objetivo de receber um conjunto de dados e aprender a recriar eles. A discriminadora tem o objetivo de reconhecer o que é real e o que foi criado pela geradora.

O modelo está completo quando a geradora consegue enganar a discriminadora. Em outras palavras, a geradora fez um trabalho tão bom em imitar os dados reais que os dados gerados por ela conseguem se passar por dados reais.
Esquema de uma rede neural generativa
Esquema de uma rede neural generativa. Na imagem, a geradora está marcada em azul e a discriminadora está marcada em vermelho. Crédito: Thalles Silva blog.

Já o ChatGPT usa um outro tipo de rede chamada de transformers. As transformers usam uma técnica chamada de attention que é capaz de processar textos e prestar atenção em diferentes partes de um texto. A atenção funciona como uma camada que consegue fitar matematicamente a compreensão de um texto.

Elas estão de fato criando coisas que não existem?

Esses modelos de inteligência artificial precisam observar dados para conseguir aprender. Esses dados são gerados de forma humana, seja através de fotografias, textos ou pinturas. Elas não criam do zero, elas são muito boas em encontrar padrões e fazer predições que parecem criadas.

É sempre bom lembrar que por trás de todos esses modelos há um algoritmo que utiliza matemática para conseguir encontrar funções que conseguem modelar algo, seja geração de textos ou de imagens.