TL;DR
- Model ID:
claude-opus-4-8 - Custo: sem alteração face ao 4.7 — $5 por milhão de tokens de input, $25 por milhão de output
- Destaques: líder no SWE-Bench Pro (69.2%), 84% no Online-Mind2Web, Effort Control em três níveis, Dynamic Workflows no Claude Code
Benchmarks: onde existe liderança e onde não
Opus 4.8 alcança 69.2% no SWE-Bench Pro em tarefas de coding agentic. OSWorld-Verified (controlo de SO) chega a 83.4%, e tarefas de navegação browser a 84%.
Limitação notável: GPT-5.5 lidera tarefas de coding em terminal com 78.2% versus 74.6% do Opus 4.8. Equipas que dependem de agentes shell devem fazer avaliações lado a lado antes de migrar.
Tool Calling: menos passos redundantes
Pratica-mente, loops de tool-calling requerem menos iterações e reduzem operações redundantes. Opus 4.8 apresenta aproximadamente 4× menor probabilidade de deixar defeitos de código passar comparado ao 4.7.
Effort Control: controlo de profundidade de raciocínio
Três níveis disponíveis:
- high: configuração padrão, raciocínio sólido sem penalidades de latência
- xhigh: profundidade extra para tarefas complexas sem custos máximos
- max: capacidade total de raciocínio para trabalho crítico
Dynamic Workflows: orquestração paralela de sub-agentes
Disponível em preview de pesquisa no Claude Code, Dynamic Workflows executa "centenas de sub-agentes em paralelo numa única sessão". O caso de uso principal envolve "migrações de grandes codebases com centenas de milhares de linhas".
Actualmente disponível nos planos Enterprise, Team e Max.
Melhorias multimodal e preços estáveis
Redução de 61% em tokens versus 4.7 para raciocínio de PDF e análise de diagramas. Os preços de input e output permanecem idênticos ao 4.7. O modo Fast alcançou melhoria de 2.5× em velocidade a um terço do custo anterior.