O que é a Web Agente? WebMCP, MCP Fetch e acesso nativo ao agente
Todas as publicações

O que é a Web Agente? WebMCP, MCP Fetch e acesso nativo ao agente

Ryan Turner
Ryan Turner · Head of Growth

A rede agênica é a tendência de tratar os agentes de IA como clientes da web de primeira classe. Em vez de um agente ter que adivinhar como agir a partir de HTML bruto, um site disponibiliza ferramentas estruturadas que o agente pode chamar diretamente. O site orienta o agente sobre como interagir, em vez de o agente ter que fazer engenharia reversa no DOM e torcer para que o layout não tenha mudado da noite para o dia.

Essa é a ideia por completo, resumida em uma frase. A web que você e eu navegamos foi criada para os olhos humanos e os cliques do mouse. A web agentiva acrescenta uma segunda interface, criada para máquinas que leem, decidem e agem em seu nome. Atualmente, dois padrões servem de base para essa interface: o WebMCP e o Model Context Protocol, com seu servidor de referência Fetch.

Pontos principais
  • A rede de agentes trata os agentes como clientes nativos, com sites que disponibilizam ferramentas que podem ser chamadas, em vez de os agentes terem que extrair dados do DOM.
  • O WebMCP, proposto no Google I/O 2026, permite que um site publique funções JavaScript e formulários HTML como ferramentas que um agente pode invocar.
  • O MCP Fetch é um servidor padrão que recupera uma URL e converte HTML para Markdown, reduzindo substancialmente o custo dos tokens do agente.
  • A adoção está em fase inicial e é desigual. A maioria dos sites não disponibilizará ferramentas nativas do agente tão cedo.
  • Até que isso aconteça, os agentes ainda precisam de navegadores, APIs de renderização e de pesquisa, além de uma rede de dispositivos reais para a cauda longa.

O que significa, na verdade, “acesso nativo ao agente”?

Acesso nativo ao agente trata-se de um modelo em que um site divulga suas próprias capacidades aos agentes, de modo que o agente chama uma função específica em vez de analisar uma página. Isso redefine o acesso à web. O modelo antigo baseia-se na detecção e na evasão: um agente carrega uma página, o site tenta identificar o bot e o agente tenta não parecer um. O acesso nativo ao agente, por outro lado, transforma isso em um problema de endereçamento e protocolo, mais próximo de chamar uma API do que de extrair dados de uma tela.

Essa distinção é importante porque o tráfego gerado por bots já não é mais um caso isolado. Em 2024, os bots automatizados representavam 51% de todo o tráfego da web, sendo a primeira vez em uma década que as máquinas ultrapassaram os seres humanos, de acordo com Imperva, Relatório sobre bots maliciosos de 2025. Quando a maioria dos seus visitantes é composta por softwares, criar uma interface para softwares deixa de ser opcional e passa a ser design.

Há também um motivo menos evidente. Quando um site pode oferecer a um agente um caminho claro e autorizado, ele controla o que o agente vê e faz. Consequentemente, isso é mais previsível para o proprietário do site do que permitir que milhares de rastreadores improvisem em um layout que nunca foi concebido para eles. O site define as regras, o agente as segue, e ambas as partes têm menos surpresas.

Isso também altera o modo de falha. A extração de dados do DOM falha silenciosamente quando o nome de uma classe muda ou um botão se move; uma ferramenta nativa do agente ou existe ou não existe, e um contrato versionado pode sinalizar isso explicitamente. Pelo que observamos nas cargas de trabalho dos agentes, os engenheiros responsáveis pela camada de acesso tendem a preferir o segundo tipo de falha, pois ela é evidente e testável, em vez de silenciosa e intermitente. Para obter mais informações sobre por que isso é importante em toda a pilha, consulte conceder aos agentes de IA acesso à web em tempo real.

Como funciona o WebMCP?

WebMCP é uma proposta de padrão, apresentada no Google I/O 2026, que permite que um site exponha suas próprias funções JavaScript e formulários HTML como ferramentas que um agente baseado em navegador pode chamar. De acordo com Chrome, Chrome na I/O 2026, o site declara o que um agente pode fazer; o agente lê essas declarações e as invoca como chamadas de API. Em resumo, a página descreve suas próprias ações, em vez de obrigar o agente a inferi-las.

Imagine um fluxo de finalização de compra. Sem o WebMCP, um agente precisa localizar os campos de preenchimento corretos, preenchê-los, encontrar o botão de envio e confirmar o resultado, tudo isso lendo pixels e nós do DOM que podem sofrer alterações entre as versões. Com o WebMCP, por outro lado, o site publica um submitOrder ferramenta com parâmetros tipados. O agente a chama. Sem adivinhações de seletores, sem esperas instáveis por elementos que demoram a ser renderizados.

Duas características tornam isso útil. Primeiro, o contrato é explícito: o site declara quais são suas ferramentas, de modo que o agente não precisa fazer engenharia reversa para determinar a intenção. Em segundo lugar, o agente é executado na própria sessão do navegador do usuário, o que significa que ele atua com as permissões e a identidade que o usuário já possui. Isso evita uma série de problemas de acesso, embora apenas em sites que ofereçam suporte ao WebMCP, o que, atualmente, representa um conjunto restrito.

O que é o MCP Fetch e por que ele é importante?

MCP Fetch é o servidor Fetch de referência no ecossistema do Model Context Protocol. Ele desempenha bem uma única função: receber uma URL, recuperar a página e converter o HTML em Markdown de forma que um agente possa lê-lo. De acordo com o Repositório de servidores do Protocolo de Contexto de Modelos, trata-se de uma ferramenta padrão e reutilizável à qual qualquer agente compatível com MCP pode se conectar para a recuperação básica de páginas.

A conversão para Markdown é o ponto principal. O HTML bruto está sobrecarregado com elementos de navegação, scripts, estilos e marcadores de rastreamento dos quais um agente não precisa e pelos quais paga em tokens. Reduzir uma página ao Markdown limpo diminui substancialmente a contagem de tokens — muitas vezes em mais da metade —, o que reduz o custo e libera mais espaço na janela de contexto do modelo para o raciocínio propriamente dito. Por exemplo, um agente que carrega uma página de produto como HTML bruto pode gastar a maior parte de seu orçamento em menus e tags de script antes de chegar ao único parágrafo de que precisa. O artigo do profissional em dev.to, Ferramentas de navegador para agentes de IA – Parte 4 explica essa relação de compromisso em detalhes.

O MCP Fetch e o WebMCP lidam com camadas diferentes. O Fetch lida com a leitura: busca uma página e retorna o texto limpo. O WebMCP, por outro lado, lida com a ação: chama as funções declaradas de um site para realizar alguma ação. A maioria dos fluxos de trabalho de agentes reais precisa de ambos, e observamos que as equipes constroem sua própria camada de recuperação com base nessas primitivas, em vez de tratar qualquer um dos padrões como o pipeline completo.

Tenha clareza sobre até onde o Fetch vai. Ele recupera e converte, mas não executa JavaScript, não resolve uma página de desafio nem altera a rota de saída quando um site bloqueia a solicitação. Em um artigo estático, ele funciona bem. Em um aplicativo de página única ou em um destino protegido, no entanto, ele retorna uma estrutura vazia ou uma página de erro, e é por isso que as equipes o combinam com uma renderização mais pesada para qualquer situação que apresente resistência. Se o senhor estiver construindo esse pipeline por conta própria, criar um MCP Server para extração de dados da web abrange o padrão de ponta a ponta.

O que isso significa para os agentes de hoje?

Os agentes atuais ainda precisam de navegadores, APIs de renderização e pesquisa, além de uma rede de dispositivos reais, pois os padrões nativos para agentes estão em fase inicial e sua adoção é desigual. O WebMCP é uma proposta. O MCP Fetch, por sua vez, lida apenas com páginas simples e acessíveis. A grande maioria da web não disponibiliza ferramentas nativas para agentes, e uma parcela significativa bloqueia ativamente o acesso automatizado. Os padrões são complementares nesse contexto, não substitutos.

O bloqueio é real e está se intensificando. Em 2025, a Cloudflare passou a bloquear, por padrão, os rastreadores de IA em cerca de 20% da web a partir de 1º de julho, de acordo com Cloudflare, A Cloudflare acaba de mudar a forma como os rastreadores de IA coletam dados da Internet em geral. Os editores de notícias foram além: em 2025, cerca de 79% dos principais sites de notícias bloquearam os bots de treinamento de IA, de acordo com Press Gazette, Oito em cada dez dos maiores sites de notícias do mundo bloqueiam agora os bots de treinamento de IA. Uma ferramenta WebMCP simples, portanto, não adianta nada para os milhões de sites que nunca irão implementá-la.

Portanto, os dois mundos coexistem. Quando um site adota o WebMCP ou atende de forma direta ao MCP Fetch, o acesso se torna mais simples e o modelo de endereçamento se destaca. Para a “cauda longa”, por outro lado, os agentes precisam de renderização real e de origens de dispositivos de usuários reais para acessar o conteúdo da mesma forma que um visitante comum faria. A saída é mais importante do que as pessoas imaginam em alvos protegidos. Em nossos testes comparativos com fornecedores, as solicitações de IPs residenciais costumam ser bem-sucedidas em sites protegidos em taxas muito mais altas do que as de IPs de data centers, frequentemente na faixa de 85 a 99%, contra cerca de 20 a 40% para os data centers — razão pela qual as equipes encaminham os casos mais complexos por meio de origens de dispositivos reais. Essa é a camada coberta pela rede de acesso a dispositivos da Massive e pela Web Render API: HTML ou Markdown limpo de qualquer fonte pública, em qualquer local, incluindo os sites que nunca exporão uma ferramenta. Os padrões facilitam os casos simples; eles não eliminam os casos complexos. Quanto ao lado do raciocínio desse pipeline, treinamento de LLMs com dados da web em tempo real relaciona a recuperação à saída do modelo.

Fontes

Perguntas frequentes

A “web agênica” é um padrão real ou apenas um exagero?+

Trata-se de uma direção, respaldada por propostas concretas. O WebMCP foi apresentado no Google I/O 2026 e o MCP Fetch já está disponível no repositório dos servidores do Model Context Protocol. Os componentes já existem. A adoção generalizada ainda não ocorreu; portanto, considere-a como uma infraestrutura emergente, e não como uma plataforma pronta na qual se possa confiar em toda a web aberta.

O WebMCP substitui o web scraping?+

Não, não tão cedo. O WebMCP só funciona em sites que o implementam, o que, atualmente, representa um número reduzido. Para todo o restante, os agentes continuam analisando as páginas, executando JavaScript e roteando o tráfego por redes de dispositivos reais para acessar o conteúdo. Planeje ambas as opções em ambiente de produção, em vez de apostar no suporte nativo universal dos agentes.

Qual é a diferença entre o WebMCP e o MCP Fetch?+

O MCP Fetch lê: ele recupera uma URL e converte o HTML para Markdown para que o agente possa utilizá-lo. O WebMCP age: ele permite que um site exponha funções e formulários que podem ser chamados, para que um agente possa realizar tarefas. Ler versus agir. A maioria dos fluxos de trabalho utiliza ambos em conjunto.

Por que converter HTML para Markdown para os agentes?+

O HTML bruto contém elementos de navegação, scripts e estilos que desperdiçam tokens e sobrecarregam a janela de contexto. O Markdown reduz tudo isso a um conteúdo legível, diminuindo substancialmente o número de tokens, muitas vezes em mais da metade. Menor custo, entrada mais limpa e mais espaço disponível para que o modelo analise o que realmente importa.