OpenAI Revela Novos Modelos da Série o3, Afirmando Aproximação ao AGI

A OpenAI anunciou nesta sexta-feira a série de modelos o3, sucedendo os modelos de raciocínio o1 lançados no início do ano. A novidade foi divulgada durante o último dia do evento “shipmas”. A série inclui o3 e o3-mini, um modelo menor e ajustado para tarefas específicas.

Inovação e Controvérsia

Os novos modelos prometem desempenho superior em domínios como física, ciência e matemática, graças a uma técnica de raciocínio autônomo que verifica etapas e planeja respostas. No entanto, a OpenAI admitiu que o modelo ainda pode cometer erros, como visto com o o1. Além disso, testes preliminares levantaram preocupações de segurança, com o o1 apresentando maior propensão a tentativas de engano do que modelos concorrentes.

A técnica “alinhamento deliberativo” foi aplicada ao o3 para mitigar riscos de segurança. Apesar disso, o impacto real dos modelos só será compreendido após avaliações independentes.

Resultados Impressionantes em Testes

O o3 superou amplamente benchmarks internos e estabeleceu novos recordes:

  • 96,7% na American Invitational Mathematics Exam (2024), errando apenas uma questão.
  • 2727 de rating no Codeforces, colocando o modelo no topo de habilidades de programação.
  • 87,7% em GPQA Diamond, que inclui perguntas de nível avançado em biologia, física e química.
  • Recorde de 25,2% no Frontier Math da EpochAI, enquanto outros modelos não ultrapassaram 2%.

Mesmo assim, os resultados internos da OpenAI precisam de validação externa para comprovar a eficácia real dos modelos.

Ajuste de Tempo de Raciocínio e Implicações Econômicas

Uma das inovações do o3 é a capacidade de ajustar o tempo de raciocínio em níveis baixo, médio e alto, permitindo maior precisão em tarefas complexas, mas a um custo considerável. Os testes no nível mais alto foram descritos como extremamente caros, chegando a milhares de dólares por desafio.

Isso levanta dúvidas sobre a viabilidade econômica de tais modelos no mercado, especialmente em comparação com abordagens alternativas de inteligência artificial.

Aproximação ao AGI?

A OpenAI sugere que o o3 pode estar se aproximando da inteligência geral artificial (AGI), mas com ressalvas. Em um teste ARC-AGI, que avalia a habilidade de adquirir novas competências, o o3 obteve 87,5% no nível de alta computação, superando em muito seu antecessor. No entanto, especialistas apontaram que o modelo ainda falha em tarefas simples, demonstrando limitações significativas em comparação com a inteligência humana.

Concorrência e Desafios Futuros

Desde o lançamento dos modelos de raciocínio da OpenAI, empresas como Google, Alibaba e DeepSeek entraram na disputa, apresentando seus próprios modelos de raciocínio. Apesar do hype, especialistas questionam a sustentabilidade dessas abordagens devido aos altos custos e incertezas sobre progresso a longo prazo.

A OpenAI enfrenta novos desafios com a saída de Alec Radford, uma figura-chave no desenvolvimento dos modelos GPT, que anunciou sua saída para realizar pesquisas independentes.

Fontes:

Compartilhar

Relacionadas