Por que Multi-agent e quando usar
Sistemas multi-agent consomem aproximadamente 15× mais tokens que interacções de chat padrão. Devem ser implementados apenas quando o problema genuinamente requer decomposição distribuída de tarefas — quando a complexidade excede a janela de contexto de um único agente, as subtarefas podem ser paralelizadas de forma independente e os outputs de cada agente são avaliáveis isoladamente.
Padrão 1: Orchestrator-Worker
Um agente líder (Claude Sonnet) toma decisões e delega para workers especializados (Claude Haiku). Ideal para 3-5 especialistas com fluxos dinâmicos mas previsíveis.
Exemplo prático: análise de contratos com extracção de cláusulas, classificação de risco e geração de sumário executivo — cada etapa num worker dedicado.
Padrão 2: Hierarchical
Estende o padrão Orchestrator em estruturas de árvore com sub-orchestrators gerindo equipas de domínio. Reduziu custos de tokens em aproximadamente 30% comparado à orquestração plana ao misturar modelos caros em pontos de decisão com modelos baratos na execução.
Padrão 3: Swarm
Agentes pares entregam o controlo explicitamente sem supervisão central. Workers gerem handoffs baseados em mudanças de contexto. Adequado para suporte ao cliente onde triagem redireciona para especialistas em facturação ou técnicos sem hierarquia.
Anti-padrão Crítico
Cuidado com "quatro prompts em paralelo" disfarçados de multi-agent — chamar o mesmo modelo múltiplas vezes de forma assíncrona sem gestão de estado, rastreamento de trace ou lógica de retry coordenada. Isto é paralelização, não orquestração, e falha catastroficamente em produção.
Stack de Implementação
- Laravel 11 com Prism PHP e PrismAgents library
- PostgreSQL para rastreamento de estado do AgentRun
- Redis para gestão de filas
- Logging estruturado com propagação de trace ID
Análise de Custo (200 execuções em produção)
| Padrão | Tokens Médios | Custo Relativo |
|---|---|---|
| Orchestrator plano (Sonnet) | ~38k | 1.00× |
| Hierarchical (Sonnet + Haiku) | ~41k | 0.71× |
O padrão hierárquico alcança custos mais baixos apesar do maior consumo de tokens porque Haiku trata ~80% do volume de trabalho a uma fracção do preço do Sonnet.