Implementação rodando no ambiente local dedicado da Amazing. Agentes de produção executam tarefas do /tasks contra a spec versionada. Agentes de teste validam cobertura, contratos e regressão antes do humano olhar. Cada PR sai documentado e pronto pra revisão.
Agente solto recebe instrução, gera código plausível, retorna. Sem spec, sem hook, sem teste rodando junto, o output depende totalmente da sorte do prompt e do estado do modelo naquele momento. Funciona, mas é loteria.
O custo é variabilidade: sprint que entrega bem, sprint que entrega medíocre, sprint que retrabalha. O time não consegue prever ritmo. Compromissos viram chute. Cliente perde confiança no cronograma.
Execução Amazing roda contra trilho: spec versionada, harness ativo, agente de teste validando, sênior revisando. Resultado consistente, sprint após sprint.
Cada execução começa por uma tarefa atômica gerada pelo Spec Kit. Entrada definida, saída esperada, contexto carregado do vault.
Implementação roda no ambiente dedicado, lendo a spec aprovada como fonte. Commits atômicos, pequenos, revertíveis. Histórico legível.
Testes nascem junto com código. Contratos verificados, cobertura medida, regressão checada. Falha bloqueia merge automaticamente.
Pull Request com descrição, checklist da spec marcado, testes verdes, doc QMD atualizada. O sênior recebe pra revisar conteúdo, não detalhe.
$ amazing /implement T07 › Lendo spec: specs/pix-auto.qmd § 3.4 › Lendo vault: ADR-014 (idempotência) › Executando em ambiente dedicado + commit: implement check_balance src/payment/balance.py · +47 -3 test/balance_test.py · +89 novas + commit: add idempotency hook src/payment/idempotent.py · +28 test/idempotent_test.py · +52 + commit: wire endpoint src/api/pix.py · +14 docs/api/pix.qmd · atualizada [agente de teste] ✓ contract match · spec § 3.4 ✓ coverage · 96% (min 90%) ✓ regression suite · 1247 pass ✓ idempotency property tests · ok ✓ bacen audit hook · ok › PR #284 aberto › aguardando revisão do sênior
Execução com trilho elimina a variabilidade. Sprint após sprint, mesmo método, resultado confiável.
Mesma disciplina em cada PR, independente do sprint.
Mínimo enforçado por hook. Padrão real costuma passar de 95%.
Tarefa do /tasks vira PR pronto em ciclo curto.
PR rejeitado é exceção. A maioria entra com ajuste pequeno.
O agente que escreve código você consegue contratar. O ambiente que faz ele entregar com qualidade consistente é o que diferencia a Amazing de IA solta.
Cada execução roda em máquina isolada, com harness próprio, sem cross-contamination.
Não é etapa separada. O agente de teste roda no mesmo ciclo do agente de produção.
Lint, formato, contrato e cobertura são automatizados. Humano olha decisão.
No Pix Automático, semanas 2 e 3 rodaram 12 tarefas em paralelo entre 4 agentes. Cada PR documentado, testado, validado contra spec.
Ver o casoDemo ao vivo em 30 minutos. Você acompanha uma task indo do /implement até o PR pronto pra revisão.