Oubliez le navigateur : comment la conversion HTML-Markdown réduit les coûts liés aux jetons d'agent de 80 %

Ryan Turner · Head of InnovationJune 10, 2026

Pour la plupart des tâches d'agent en lecture seule, vous n'avez absolument pas besoin d'un navigateur complet. Récupérez la page, convertissez-la en Markdown épuré, puis transmettez-la au modèle. Le fait de supprimer les balises, les scripts et les styles avant que le modèle ne lise quoi que ce soit élimine le bruit dont le modèle n'a jamais besoin. Vous réduisez ainsi votre facture de tokens, souvent de plus de la moitié.

L'erreur consiste à considérer chaque tâche Web comme un problème d'automatisation du navigateur. Lire une page de documentation, récupérer un article ou extraire les caractéristiques d'un produit relève d'un problème de récupération et de conversion. Vous ne faites appel au navigateur que lorsque la page vous pose des difficultés.

Points clés à retenir

Pour les tâches en lecture seule, récupérez le contenu et convertissez-le au format Markdown plutôt que d'utiliser un navigateur.
Le code HTML brut gaspille des jetons pour le balisage, les scripts intégrés, les styles et les éléments standard que le modèle ignore.
Les professionnels font état de réductions symboliques d'environ 80 % grâce à cette substitution ; mesurez vous-même vos pages avant de vous fier à un chiffre quelconque.
Utilisez le serveur de référence MCP Fetch ou une API de rendu qui renvoie directement du code Markdown.
Utilisez un véritable navigateur pour les connexions, les contenus accessibles uniquement via JavaScript et les flux interactifs.

Cet article fait partie d'un guide plus complet consacré à la manière de donner aux agents IA un accès en temps réel au Web. Nous nous concentrons ici sur la solution la plus économique : évitez d'utiliser le navigateur lorsque c'est possible.

Pourquoi le code HTML brut consomme-t-il autant de tokens ?

Le code HTML brut contient une grande quantité de données dont le modèle n'a pas besoin. Conversion HTML vers Markdown Il s'agit de l'étape qui supprime les balises, les scripts intégrés, les blocs de style, les pixels de suivi, les éléments de navigation et le code standard du pied de page, pour ne conserver que le contenu lisible. Le modèle facture chacun de ces tokens supprimés lors de l'entrée. De plus, ce coût est réitéré à chaque page, à chaque exécution, pour chaque agent de votre flotte.

Prenons l'exemple d'une page d'article classique. Le texte qui vous intéresse peut compter quelques milliers de mots. Le code HTML qui l'entoure, en revanche, contient <div> l'imbrication, les « class soup », les extraits d'analyse et l'infrastructure publicitaire qui prennent souvent le pas sur le contenu. Si vous introduisez tout cela directement dans une fenêtre contextuelle, vous gaspillez votre budget dans une structure que le modèle va de toute façon écarter.

Le Markdown, en revanche, conserve le contenu et élimine le superflu. Les titres restent des titres, les liens restent des liens et les listes restent des listes. Tout le reste — les scripts, la mise en forme, les éléments de mise en page — disparaît. Vous retenez le sens, et non la structure technique.

L'ampleur de ce phénomène est importante, car les agents seront bientôt omniprésents. Pour 2025, Gartner prévoit que Gartner, Gartner prévoit que 40 % des applications d'entreprise intégreront des agents IA dédiés à des tâches spécifiques d'ici 2026 D'ici fin 2026, 40 % des applications d'entreprise intégreraient des agents IA dédiés à des tâches spécifiques, contre moins de 5 % en 2025. Par conséquent, lorsque ce nombre d'agents consulte le Web, le gaspillage de tokens par page finit par représenter un poste de dépense non négligeable.

À combien s'élèvent réellement les économies réalisées grâce à la conversion HTML vers Markdown ?

Les économies réalisées sont importantes mais varient en fonction du nombre de pages ; considérez donc tout chiffre annoncé comme un point de départ et non comme une promesse. Selon dev.to, les professionnels font état de réductions d'environ 80 % grâce à la conversion du code HTML en Markdown avant que le modèle ne le lise, Outils de navigation pour les agents IA – 4e partie : se passer du navigateur (2026). Ce chiffre est fourni par les professionnels et les fournisseurs eux-mêmes ; il n’a pas fait l’objet d’une vérification indépendante. Il convient donc de le classer dans la colonne « hypothèses » plutôt que dans votre budget. Par exemple, une page riche en contenu et structurée avec un balisage léger permettra de réaliser moins d’économies qu’une coque d’application surchargée de scripts qui ne cache qu’un seul paragraphe de texte réel. Les deux s’allègent, mais le rapport varie considérablement d’une page à l’autre. Mesurez donc vos propres cibles. Nous avons procédé au comptage des tokens de cette manière sur des pages représentatives : prenez-en dix, comptez les tokens de la version HTML brute et de la version Markdown, puis observez l’écart. Lors de nos tests, vous constaterez généralement des réductions bien supérieures à la moitié, parfois bien plus encore. Cependant, le seul chiffre qui compte pour votre budget est celui que vous avez mesuré sur vos propres pages. Basez votre modèle de coûts sur ce chiffre, et non sur un titre accrocheur.

Cette habitude s'avère doublement bénéfique. D'une part, vous réduisez dès aujourd'hui le nombre de jetons d'entrée. D'autre part, vous établissez une base de référence qui permet de signaler les régressions lorsque le site cible modifiera sa mise en page au cours du prochain trimestre. D'après notre expérience dans le domaine des charges de travail des agents, cette base de référence fait toute la différence entre repérer un pic de coûts sur un tableau de bord et le découvrir sur une facture.

Comment convertir du code HTML en Markdown dans un pipeline d'agent ?

Deux modèles couvrent la plupart des cas de figure : un outil de récupération et de conversion intégré à votre agent, ou une API de rendu qui renvoie directement du Markdown. Les deux permettent d'éliminer les mêmes éléments parasites. La différence réside dans l'identité de celui qui effectue la récupération et dans la manière dont celle-ci gère les sites qui résistent à l'accès automatisé.

Option 1 : le serveur de référence MCP Fetch

Le point d'entrée le plus simple est le serveur de référence MCP Fetch, qui récupère une URL et convertit le code HTML en Markdown en une seule étape. Il est fourni dans la version officielle Dépôt des serveurs du protocole Model Context, de sorte que tout agent compatible avec MCP peut l'utiliser comme un outil. Pour les documents internes, les articles publics et les sites qui ne bloquent pas les robots, cela suffit souvent.

Le problème, c'est l'accès. Une simple requête est envoyée depuis l'adresse IP de votre serveur, et une part croissante du Web considère désormais le trafic automatisé inconnu comme hostile. En 2025, Imperva, Rapport 2025 sur les bots malveillants Une étude a révélé que les robots automatisés représentaient 51 % de l’ensemble du trafic Web en 2024, marquant la première fois en dix ans que les robots dépassaient les utilisateurs humains, les robots malveillants représentant quant à eux 37 %. Par conséquent, les systèmes de défense adaptés à ce volume bloqueront souvent une requête « naked fetch » avant même que vous ne puissiez récupérer le code HTML à convertir.

Option 2 : une API de rendu qui renvoie du Markdown

Lorsque la cible résiste à une requête de récupération standard, acheminez cette requête vers une infrastructure conçue pour contourner le blocage et demandez-lui de renvoyer directement le contenu au format Markdown. Le service Web Render API de Massive expose un point de terminaison « Browsing » avec format=markdown, de sorte que la page s'affiche prête à l'utilisation en un seul appel. Pas d'étape de récupération distincte, pas de convertisseur côté client à gérer, pas de code HTML stocké en mémoire.

Deux éléments rendent cette solution applicable à grande échelle. Premièrement, Markdown est un format de sortie à part entière au niveau du point de terminaison, et non une fonctionnalité rajoutée après coup ; la conversion s'effectue donc au moment même où la page est affichée. Deuxièmement, la requête est émise depuis un véritable réseau d’appareils grand public couvrant plus de 195 pays et comptant environ 1,3 million d’appareils actifs par jour ; la requête parvient ainsi à atteindre les sites qui rejettent le trafic provenant des centres de données. Proxys résidentiels Il s'agit de connexions qui transitent par de véritables appareils grand public plutôt que par des plages d'adresses de centres de données, ce qui explique pourquoi elles sont considérées comme des visiteurs ordinaires. Nous avons mesuré cet écart dans notre propre analyse comparative des fournisseurs : les adresses IP résidentielles affichent des taux de réussite sur les sites protégés bien supérieurs à ceux des adresses IP de centres de données (des fourchettes approximatives allant d’environ 85 à 99 % contre 20 à 40 %). Il convient de noter qu’il s’agit là d’une analyse comparative des fournisseurs, et non d’une étude indépendante.

Cet accès revêt une importance croissante chaque mois. En 2025, Cloudflare, Cloudflare vient de modifier la manière dont les robots d'indexation basés sur l'IA explorent l'Internet dans son ensemble a commencé à bloquer par défaut les robots d'indexation basés sur l'IA sur environ 20 % du Web à compter du 1er juillet 2025. Par conséquent, si votre requête ne parvient pas à accéder à la page, le pipeline Markdown le moins cher au monde ne renvoie aucun résultat.

Vous pouvez également paramétrer l'appel. Le point de terminaison « Browsing » propose différents niveaux de vitesse et un paramètre de difficulté, fonctionne en mode synchrone ou asynchrone, et maintient des sessions persistantes jusqu'à 12 minutes sur la même sortie lorsqu'une lecture en plusieurs étapes nécessite une continuité. Pour les lectures ponctuelles, en revanche, il suffit de réduire la requête et de passer à autre chose.

Dans quels cas avez-vous encore besoin d'un véritable navigateur ?

Vous avez tout de même besoin d'un navigateur lorsque le contenu n'existe pas tant qu'aucune opération n'est exécutée dans celui-ci. Les connexions, les formulaires en plusieurs étapes, le défilement infini et les contenus accessibles uniquement via JavaScript nécessitent tous un contexte de rendu en temps réel et une interaction réelle. La méthode « Fetch-and-convert » renvoie une page vide sur ces pages, car le balisage arrive avant les données.

La règle simple que nous appliquons : évitez d'utiliser un navigateur pour les opérations en lecture seule, et utilisez-en un pour les opérations en lecture-écriture ou interactives. Si votre tâche consiste à « lire cette page et en faire un résumé », convertissez-la au format Markdown. En revanche, s'il s'agit de « vous connecter, cliquer sur trois écrans et valider », vous aurez besoin d'un outil d'automatisation capable de gérer une véritable session. Automatisation des navigateurs Il s'agit de la pratique consistant à piloter par programmation un véritable moteur de rendu pour effectuer des clics, saisir du texte et attendre, ce que la méthode « fetch-and-convert » ne permet justement pas de faire.

Lorsque vous franchissez cette étape, le cadre et l'infrastructure revêtent tous deux une importance particulière. Par exemple, le choix de la couche d'automatisation constitue une décision à part entière, abordée dans cadres de développement pour navigateurs d'agents. De même, la question de savoir s'il vaut mieux gérer soi-même cette flotte ou l'acheter se pose très vite, ce qui est le sujet central de infrastructure de navigation gérée. L'arbre de décision est simple au départ : essayez d'abord le Markdown, et n'utilisez le navigateur que lorsque la page vous y oblige.

Une raison de plus d'opter par défaut pour Markdown : c'est de toute façon le format que votre couche de base requiert. Mise à la terre Il s'agit de la pratique consistant à fournir au modèle un contexte en temps réel, issu de la recherche, afin que ses réponses s'appuient sur des sources réelles plutôt que sur des données d'entraînement obsolètes. Le Markdown « propre » alimente directement la recherche et l'assemblage du contexte, ce qui explique pourquoi il réapparaît dans Ancrage des modèles de langage de grande envergure (LLM) à l'aide de données Web en temps réel. En d'autres termes, le fait de ne pas passer par le navigateur n'est pas seulement moins coûteux ; cela permet d'obtenir exactement le résultat attendu par le reste de votre pipeline.

Sources

Gartner. Gartner prévoit que 40 % des applications d'entreprise intégreront des agents IA dédiés à des tâches spécifiques d'ici 2026. 2025. https://www.gartner.com/en/newsroom/press-releases/26/08/2025 - Gartner prévoit que 40 % des applications d'entreprise intégreront des agents IA dédiés à des tâches spécifiques d'ici 2026, contre moins de 5 % en 2025
Imperva. Rapport 2025 sur les bots malveillants. 2025. https://www.imperva.com/resources/resource-library/reports/2025-bad-bot-report/
Cloudflare. Cloudflare vient de modifier la manière dont les robots d'indexation basés sur l'IA explorent l'Internet dans son ensemble. 2025. https://www.cloudflare.com/press/press-releases/2025/cloudflare-just-changed-how-ai-crawlers-scrape-the-internet-at-large/
dev.to. Outils de navigation pour les agents IA – 4e partie : se passer du navigateur. 2026. https://dev.to/stevengonsalvez/browser-tools-for-ai-agents-part-4-skip-the-browser-save-80-on-tokens-304c
Protocole de contexte de modèle. Serveur de référence MCP Fetch (dépôt de serveurs). 2026. https://github.com/modelcontextprotocol/servers

Foire aux questions

La conversion HTML vers Markdown réduit-elle toujours le nombre de tokens de 80 % ?+

Non. Ce chiffre de 80 % est issu des déclarations des professionnels et des fournisseurs ; il n'a pas fait l'objet d'une vérification indépendante, et le chiffre réel varie en fonction de la page. Les pages contenant beaucoup de scripts permettent de réaliser davantage d'économies, tandis que les pages plus légères en permettent moins. Par conséquent, mesurez dix de vos propres cibles afin de définir un budget fiable.

Vais-je perdre des données en convertissant du code HTML en Markdown ?+

Vous perdez la mise en page et le style, mais pas le contenu. Les titres, les liens, les listes et le texte sont conservés ; les scripts, les feuilles de style CSS et les éléments d'interface ne le sont pas. Si vous avez besoin de détails au niveau des attributs, comme des balises de données spécifiques, récupérez le code HTML brut de ces pages et convertissez tout le reste.

Pourquoi ne pas simplement aller chercher la page moi-même ?+

C'est tout à fait possible, et le serveur MCP Fetch vous facilite la tâche, jusqu'à ce que la cible vous bloque. Les bots représentant désormais la majeure partie du trafic Web et de nombreux sites bloquant par défaut les requêtes automatisées provenant de sources inconnues, les requêtes simples échouent suffisamment souvent pour qu'une Web Render API sur un réseau d'appareils réels devienne la solution la plus fiable.

La mise en forme Markdown est-elle utile pour les synthèses générées par l'IA ou les tâches de recherche ?+

Pour la lecture de pages quelconques, oui. En revanche, pour l'extraction de résultats structurés (SERP) ou de réponses générées par l'IA, un point de terminaison de recherche dédié est généralement plus adapté que la récupération des pages de résultats, car il renvoie les données déjà analysées au lieu de vous obliger à convertir le code HTML des résultats de recherche.