Portal Oficial da Cradson - Claude Opus 4.8 chegou: o que muda de verdade pra quem entrega IA em produção

TL;DR

Model ID: claude-opus-4-8
Custo: sem alteração face ao 4.7 — $5 por milhão de tokens de input, $25 por milhão de output
Destaques: líder no SWE-Bench Pro (69.2%), 84% no Online-Mind2Web, Effort Control em três níveis, Dynamic Workflows no Claude Code

Benchmarks: onde existe liderança e onde não

Opus 4.8 alcança 69.2% no SWE-Bench Pro em tarefas de coding agentic. OSWorld-Verified (controlo de SO) chega a 83.4%, e tarefas de navegação browser a 84%.

Limitação notável: GPT-5.5 lidera tarefas de coding em terminal com 78.2% versus 74.6% do Opus 4.8. Equipas que dependem de agentes shell devem fazer avaliações lado a lado antes de migrar.

Tool Calling: menos passos redundantes

Pratica-mente, loops de tool-calling requerem menos iterações e reduzem operações redundantes. Opus 4.8 apresenta aproximadamente 4× menor probabilidade de deixar defeitos de código passar comparado ao 4.7.

Effort Control: controlo de profundidade de raciocínio

Três níveis disponíveis:

high: configuração padrão, raciocínio sólido sem penalidades de latência
xhigh: profundidade extra para tarefas complexas sem custos máximos
max: capacidade total de raciocínio para trabalho crítico

Dynamic Workflows: orquestração paralela de sub-agentes

Disponível em preview de pesquisa no Claude Code, Dynamic Workflows executa "centenas de sub-agentes em paralelo numa única sessão". O caso de uso principal envolve "migrações de grandes codebases com centenas de milhares de linhas".

Actualmente disponível nos planos Enterprise, Team e Max.

Melhorias multimodal e preços estáveis

Redução de 61% em tokens versus 4.7 para raciocínio de PDF e análise de diagramas. Os preços de input e output permanecem idênticos ao 4.7. O modo Fast alcançou melhoria de 2.5× em velocidade a um terço do custo anterior.

#IA #AI Agents #Claude #Anthropic #Claude Code #LLM

Partilhar: