O Gargalo de Code Review
Geracao de codigo escala com agentes de IA. Revisao escala com engenheiros seniors. O que acontece quando essas curvas divergem e como resolver
A matematica nao fecha
Geracao de codigo escala com o numero de agentes de IA que voce roda. Revisao escala com o numero de engenheiros seniors que voce tem. Essas curvas divergem rapido.
Um CTO rodando multiplos agentes de IA em paralelo reportou processar mais de 1.000 PRs por semana. Ele nao estava exagerando. Esse e o volume real quando voce da a agentes capacidade autonoma de codificacao em uma base de codigo real. A fila de revisao nao cresce linearmente. Ela se acumula.
Um diretor de um banco tier-1 resumiu: "Resolvemos o problema de escrever codigo. Agora criamos o problema de revisar codigo."
O que acontece quando a revisao nao acompanha
Revisores passam o olho. Quando a fila tem 40 PRs, ninguem le cada linha. Aprovacao vira uma varredura rapida por problemas obvios. Problemas sutis - clausulas de guarda removidas, padroes de acesso ampliados, escalacao de erros ausente - passam despercebidos.
Seniors se esgotam. As pessoas mais qualificadas para capturar problemas tambem sao as mais demandadas. Se todo PR gerado por IA precisa do julgamento de um engenheiro senior, engenheiros seniors passam o dia inteiro revisando em vez de construindo. Os membros mais valiosos da equipe se tornam seu gargalo.
Cultura de carimbo se forma. Quando revisoes sao obrigatorias mas revisores nao tem tempo, a revisao vira uma checkbox. Ainda aparece na trilha de auditoria como "revisado e aprovado," mas nao capturou nada. Isso e pior do que nenhuma revisao, porque cria a ilusao de verificacao.
Qualidade de merge cai silenciosamente. Nao ha falha dramatica. As coisas so pioram gradualmente. Mais incidentes em producao. Sessoes de debugging mais longas. Porcoes crescentes da base de codigo que ninguem entende completamente. Quando a tendencia fica visivel, meses de mudancas nao verificadas ja foram para producao.
O que nao escala
Adicionar mais revisores. Revisar codigo de IA requer contexto profundo do sistema. Voce nao pode contratar para sair de um gargalo de revisao porque novos revisores precisam de meses para construir esse contexto. E quando eles tem, a base de codigo mudou.
Dividir revisoes entre mais pessoas. Isso distribui a carga mas fragmenta o contexto. Cada revisor ve uma fatia das mudancas mas ninguem ve o quadro completo. Problemas transversais - uma mudanca de autenticacao em um PR que conflita com uma mudanca de contrato de dados em outro - caem nos vao entre revisores.
Pedir aos revisores para serem mais cuidadosos. Quando IA gera 10x o volume, pedir aos revisores para serem mais detalhistas e pedir para beberem de uma mangueira de incendio com mais cuidado. A intencao e correta. A capacidade nao esta la.
O que muda a equacao
As equipes que lidam bem com isso nao estao escolhendo entre "revisar tudo" e "confiar na IA." Elas estao tornando a revisao proporcional ao risco.
Isso significa triagem automatizada antes de qualquer humano olhar qualquer coisa. Uma mudanca de formatacao de baixo risco nao precisa da mesma atencao que uma mudanca que toca logica de autenticacao. Mas essa triagem nao pode ser deixada para o autor do PR ou para a IA que gerou o codigo. A classificacao de risco tem que vir da mudanca em si: o que estruturalmente mudou, quantos arquivos sao afetados, quais fronteiras foram cruzadas.
Quando a classificacao de risco e objetiva e automatica, seniors gastam seu julgamento onde realmente importa. Uma fila de revisao de 40 PRs vira 5 que precisam de atencao real e 35 que foram verificados no nivel estrutural. Essa e a diferenca entre um gargalo e um workflow.