Contexto
HealthTech brasileira Series A com codebase Python/Django de 4 anos. O crescimento rápido deixou 847 issues de dívida técnica no SonarQube, 40% dos arquivos com complexidade ciclomática acima de 20 e módulos tão acoplados que nenhum dev queria refatorar.
Cada feature nova levava 3 semanas em vez de 1 — o código legado transformava mudanças simples em investigações de arqueologia. 6 incidentes por mês eram causados por efeitos colaterais inesperados entre módulos.
Solução
Agentes autônomos trabalhando em paralelo com o time de produto — sem interromper o desenvolvimento de features:
- Refactor Agent: analisa o grafo de dependências, identifica módulos com maior impacto na velocidade do time e gera PRs de refatoração atômicos — cada um isolado e reversível.
- Test Generator: antes de cada refatoração, gera testes de regressão cobrindo o comportamento existente. Se o teste quebra após a mudança, a refatoração é descartada automaticamente.
- Review Agent: valida cada PR contra as convenções do repositório, detecta mudanças de comportamento sutis e garante que a refatoração não introduz efeitos colaterais.
O time humano fazia review final e merge — zero pressão, zero risco.
Resultado
65% de redução em dívida técnica em 8 semanas. Complexidade ciclomática média caiu de 22.4 para 8.1. Zero regressões em produção — cada refatoração foi validada por testes gerados antes da mudança. O tempo para entregar features novas caiu de 3 semanas para 1 semana.
Modelo de cobrança: por módulo refatorado e validado em produção com zero regressões. Se a refatoração causa bug, o custo é da Witek.