Qu'est-ce que GPTBot ?
GPTBot Il s'agit du robot d'indexation d'OpenAI qui récupère du contenu accessible au public sur Internet afin d'entraîner ses modèles d'IA générative. Il envoie des requêtes HTTP avec une chaîne « user-agent » contenant GPTBot/1.1 ainsi qu'un lien vers la documentation d'OpenAI, ce qui permet de l'identifier dans les journaux d'accès au serveur. Le trafic peut également être vérifié par rapport aux plages d'adresses IP publiées par OpenAI (Développeurs d'OpenAI, « Présentation des robots d'indexation d'OpenAI », 2025).
Comment GPTBot accède-t-il à votre contenu ?
GPTBot explore les pages accessibles au public sans authentification, en suivant les liens à l'instar d'un robot de moteur de recherche. Chaque requête contient le GPTBot/1.1 identifiant dans l'en-tête « user-agent », afin que les serveurs web puissent le reconnaître dans les journaux. Pour empêcher GPTBot d'explorer toute partie de votre site, ajoutez User-agent: GPTBot suivi de Disallow: / à votre robots.txt fichier (Développeurs d'OpenAI, « Présentation des robots d'indexation d'OpenAI », 2025). Vous pouvez également autoriser l'exploration de certains chemins tout en bloquant d'autres, à l'aide de la norme robots.txt syntaxe des chemins d'accès.
Foire aux questions
GPTBot collecte du contenu Web accessible au public qu’OpenAI utilise pour entraîner et améliorer ses modèles d’IA générative, y compris les futures versions de GPT. Il ignore les pages nécessitant une connexion et respecte les normes robots.txt directives.
Ajoutez deux lignes au fichier robots.txt: User-agent: GPTBot sur une seule ligne et Disallow: / sur la page suivante. Cela indique à GPTBot d'ignorer l'intégralité de votre site. Vous pouvez cibler uniquement certains répertoires en indiquant les chemins d'accès individuels après Disallow au lieu de cela.
Vérifiez si la chaîne « user-agent » de la requête contient GPTBot/1.1, puis comparez l'adresse IP source aux plages d'adresses IP publiées par OpenAI dans sa documentation destinée aux développeurs (Développeurs d'OpenAI, « Présentation des robots d'indexation d'OpenAI », 2025). La combinaison de ces deux vérifications permet d'obtenir une confirmation fiable.