Da linguagem à equação: como o GPT-5.2 obteve um novo resultado em Física?

Resultado teórico envolvendo amplitudes de glúons foi inicialmente proposto por GPT-5.2 e depois demonstrado formalmente.

A OpenAI anunciou um novo resultado em física teórica obtido com o auxílio do ChatGPT-5.2, que contribuiu para identificar uma interação específica entre partículas. Crédito: Scientific American
A OpenAI anunciou um novo resultado em física teórica obtido com o auxílio do ChatGPT-5.2, que contribuiu para identificar uma interação específica entre partículas. Crédito: Scientific American

Em dezembro de 2025, a OpenAI apresentou o ChatGPT-5.2 com a descrição que era um modelo que aprendia contextos e relações de forma mais eficiente que modelos passados. Ele é um modelo de linguagem baseado em arquiteturas de redes neurais com uma arquitetura conhecida como Transformer. Ele teve bom desempenho em problemas de Matemática, Física e áreas que envolvem deduções formais, reorganização de expressões algébricas e identificação de padrões em equações complexas.

Na Física teórica, muitos problemas exigem o tratamento de equações que são não lineares e uso de manipulações para conseguir obter resultados. Um exemplo disso são os cálculos de amplitudes de espalhamento que são usados para determinar a probabilidade de partículas interagirem de uma forma específica após uma colisão. Para obter um resultado, é necessário métodos complexos como regularização e renormalização.

Em muitos casos, a obtenção de resultados analíticos é inviável e, por causa disso, há a necessidade de novas abordagens matemáticas. Em um trabalho recente divulgado pela OpenAI, pesquisadores utilizaram o ChatGPT-5.2 como ferramenta para calcular a amplitude de espalhamento de uma interação entre partículas mediada por glúons. O modelo propôs uma nova fórmula para uma amplitude de glúon que, mais tarde, foi comprovada por um modelo interno e verificada formalmente pelos autores.

Problema das amplitudes

Na Física de partículas, a amplitude de espalhamento é a grandeza utilizada para calcular a probabilidade de que determinadas partículas interajam de uma forma específica. No caso dos glúons, que são as partículas mediadoras da força nuclear forte, muitas amplitudes apresentam formas matemáticas mais simples quando se consideram apenas os diagramas mais simples. Essas simplificações ajudam a encontrar estruturas matemáticas na teoria quântica de campos.

Múons são partículas semelhantes ao elétron, com carga elétrica negativa, porém cerca de 200 vezes mais massivas e decaem rapidamente em outras partículas.

Entretanto, existe uma configuração dessas amplitudes que é considerada nula pelos pesquisadores. Essa configuração é considerada quando o glúon possui uma propriedade chamada de helicidade negativa, já os outros glúons possuem helicidade positiva. Nessa condição, a amplitude de espalhamento deve ser zero e, por essa razão, essa configuração foi historicamente tratada como trivial ou irrelevante em muitos estudos.

Uso do ChatGPT-5.2

Um trabalho recente que foi publicado no site da OpenAI mostrou que essa conclusão que ignora essa configuração de múon está incorreta. Na verdade, a amplitude nula depende da suposição de momentos das partículas. Os autores identificaram uma região específica do espaço de momentos na qual os glúons obedecem a uma condição especial de alinhamento. Nesse espaço, o argumento deixa de valer e a amplitude não se anula.

A fórmula final apresentada para esse resultado foi inicialmente conjecturada pelo GPT-5.2 Pro. Os autores humanos calcularam manualmente alguns casos, obtendo expressões derivadas da expansão em diagramas de Feynman. O modelo reduziu essas expressões a formas muito mais compactas ao identificar um padrão geral e propôs uma fórmula válida geral. Mais tarde, a expressão foi verificada analiticamente por meio de relações e verificação dos autores humanos.

Raciocínio de LLMs

Nesse trabalho, vemos um modelo de linguagem (LLM) sendo usado para resolver uma equação de Física enquanto encontra um padrão. Esses modelos estão sendo usados em problemas de exatas porque conseguem manipular estruturas simbólicas. Durante o treinamento, esses modelos internalizam padrões matemáticos, identidades algébricas, regras de transformação e demonstrações. Com isso, eles podem reorganizar termos, fatorar padrões e testar generalizações.

Modelos de raciocínio podem analisar expressões complexas e identificar padrões em equações, ajudando na simplificação de cálculos e na formulação de novas hipóteses. Crédito: Matt Strassler
Modelos de raciocínio podem analisar expressões complexas e identificar padrões em equações, ajudando na simplificação de cálculos e na formulação de novas hipóteses. Crédito: Matt Strassler

Além disso, versões atuais desses modelos podem ser estruturadas com mecanismos de raciocínio em múltiplas etapas, verificação intermediária e exploração de hipóteses alternativas. Isso permite que proponham resultados a partir de casos particulares calculados explicitamente. Em problemas de Física teórica, onde a dificuldade muitas vezes está na explosão combinatória das expressões e não na ausência de estrutura matemática, essa habilidade de compressão e generalização torna as LMs ferramentas úteis.

Fim dos cientistas?

O uso de modelos de linguagem em pesquisa científica não elimina o papel do cientista, mas está em um processo de transformação. Antes da aplicação da IA, é necessário formular corretamente o problema, definir hipóteses físicas consistentes, escolher o regime teórico adequado e estabelecer critérios de validação. Durante o processo, pesquisadores precisam interpretar as saídas do modelo, verificar coerência matemática e checar compatibilidade com princípios físicos fundamentais.

A IA pode acelerar etapas técnicas e sugerir padrões, mas a direção conceitual e o julgamento crítico continuam sendo responsabilidades humanas. Além disso, não é possível confiar cegamente em sistemas de IA. Modelos podem produzir resultados formalmente plausíveis, porém incorretos ou inconsistentes com restrições físicas conhecidas. Por isso, todo resultado deve ser submetido a demonstrações formais independentes, verificação por métodos alternativos e comparação com resultados estabelecidos.

Referência da notícia

GPT‑5.2 derives a new result in theoretical physics