Newsletter · Capital Pulse·22 de maio de 2026

O agente que age (e o que ainda não age)

A maioria dos agentes de IA no mercado são chatbots reembalados. Usando o Tom, agente da AirPoint, como âncora, a edição explora o conceito de agent washing, os dados reais de desempenho dos melhores modelos e o que diferencia um agente que promete de um que entrega.

João Piccioni

Tom nasceu com um propósito simples: ensinar as pessoas a viajar melhor usando pontos e milhas. Ele deveria explicar os conceitos fundamentais, propor alguns caminhos e orientar quem ainda se perde nesse universo. Um tutor digital. Útil, mas contido.

Aconteceu algo interessante no caminho.

À medida que o projeto avançou, Tom foi ganhando escopo. Parte por conta das nossas decisões, parte pela serendipidade que a inteligência artificial proporciona quando você está atento a ela. Hoje, além de ensinar os fundamentos, Tom já busca ativamente as melhores oportunidades para otimizar pontos e milhas, apresenta rotas alternativas, encontra hotéis e revela alguns atalhos que a maioria dos viajantes nunca encontraria sozinha. E em breve ele fará algo que muda de vez a natureza do serviço: avisará o usuário sobre alertas relevantes, acompanhará a jornada de viagem de ponta a ponta e, quem sabe, chegará ao momento em que fará reservas de forma autônoma, sem que o usuário precise perguntar nada.

Tom é o agente de viagens que estamos construindo na AirPoint. E é a partir dessa experiência concreta — e de suas contradições — que quero falar sobre o estado real dos agentes de inteligência artificial.

O mercado hoje é ruidoso. Toda empresa com um chatbot renovado o chama de "agente". Toda interface que encadeia duas chamadas de API vira "sistema agêntico". O Gartner tem um nome para esse fenômeno: agent washing (o equivalente digital do greenwashing) onde a embalagem muda mas o produto permanece o mesmo. A empresa identificou que, dentre os milhares de fornecedores que se autodeclaram agentes, apenas cerca de 130 entregam sistemas com autonomia real. O restante, mais de 95%, são chatbots reembalados em uma linguagem de ficção científica.

Os números de desempenho contam a mesma história. O WebArena, benchmark que testa modelos em tarefas do mundo real, mostra que mesmo os melhores sistemas disponíveis hoje acertam menos da metade do que tentam. A taxa máxima de sucesso registrada é 45,7%. E há um problema de composição que raramente aparece nos comunicados de imprensa: um agente com 85% de confiabilidade por etapa, num fluxo de dez passos, chega ao fim com apenas 20% de chance de ter feito tudo certo. Cada erro compõe o seguinte.

Isso não é desastroso. É só a matemática.

Quem constrói agentes de verdade sabe do que estou falando. A prática revela rapidamente que a inteligência artificial, na sua forma atual, não é para qualquer arquiteto (apesar de abrir as portas para qualquer um que quiser aprender). A fundação do projeto precisa ser sólida porque os pontos de falha se multiplicam silenciosamente quando a arquitetura é frágil. Os tokens utilizados para construir acabam. As máquinas ficam sobrecarregadas (haja memória RAM…). Aprender a lidar com diferentes modelos e saber roteá-los entre si é uma habilidade que demora a ser construída e que, quando desenvolvida, transforma o projeto: modelos diferentes têm perspectivas diferentes, e a escolha certa para cada etapa barateia a construção e melhora o resultado.

A atenção dos responsáveis pelo projeto precisa ser plena, dado que os desenvolvimentos acontecem de forma paralela e em velocidade que desafia qualquer planejamento linear. Não é tarefa para quem quer delegar o pensamento à máquina. É tarefa para quem entende que a máquina ainda precisa de um arquiteto presente (o tal do “man in the loop”).

A experiência no setor de viagens tem sido um bom termômetro. Um mercado amplo, repleto de alternativas e com um potencial enorme de expansão. O Google está construindo ferramentas de reserva agêntica. Sabre, PayPal e a MindTrip lançaram agora nesse trimestre o que chamam de a primeira cadeia completa de reservas autônomas, cobrindo mais de 420 companhias aéreas e dois milhões de propriedades hoteleiras. O Booking também tem seus próprios experimentos. Todos correndo para conceber o agente que o viajante vai confiar.

Mas os viajantes ainda não confiam. Apenas 2% deles se sentem à vontade para deixar uma IA fazer uma reserva de forma autônoma. Esse número é revelador: a tecnologia avança mais rápido do que a confiança, e essa, por sua vez, só vem da entrega consistente ao longo do tempo.

A diferença entre o agente que promete e o agente que entrega não está na tecnologia, mas sim na obsessão com o detalhe.

É aqui que entra o Tom. Estamos próximos da primeira versão que realmente entrega algo concreto ao usuário. Tom passará a responder perguntas que o usuário ainda não fez: qual é a melhor janela para resgatar aquela rota com os seus pontos, qual voo ficou disponível para aquela data que você tinha marcado, o que pode tornar essa viagem mais interessante do que você imaginou. Iniciativa, não reação.

Isso é o que separa um agente de um chatbot com neurônios extras. Não é a interface, não é o nome, não é o comunicado de lançamento. É a capacidade de agir antes de ser acionado e de acertar quando age.

Tom ainda está aprendendo. Mas a outra margem (ou a próxima viagem) já está à vista.

Forte abraço,

João Piccioni

O agente que age (e o que ainda não age)

Análise semanal sobre mercados, tecnologia e o que importa antes de importar.