Accueil / Glossaire SEO GEO / Bot (robot / crawler)
GEO & IABot (robot / crawler)
Un programme automatique qui explore le web. On distingue les bots des moteurs (Googlebot), des outils SEO (Semrush, Ahrefs) et des IA (GPTBot, ClaudeBot).
Comment fonctionne Bot
Un bot part d'une liste d'URL de depart, telecharge chaque page, en extrait le contenu et les liens, puis ajoute ces liens a sa file d'attente : c'est le crawl. Il respecte (ou non) le fichier robots.txt qui autorise ou bloque certains chemins, et s'identifie via son user-agent. Selon son role, il indexe pour un moteur, collecte des donnees SEO, ou aspire du texte pour entrainer une IA. Un bon crawl budget bien gere evite qu'il s'epuise sur des pages sans valeur.
Exemple concret
Sur les logs serveur d'un site e-commerce, on distingue plusieurs bots sur une journee. Googlebot visite 4 800 pages pour l'indexation. AhrefsBot en explore 1 200 pour cartographier les liens. GPTBot et ClaudeBot passent sur 600 pages produits, signe qu'un contenu peut nourrir les reponses d'IA. En analysant les user-agents, on repere que Googlebot ignore 300 URL de filtres a facettes sans interet : on les bloque dans robots.txt pour concentrer le crawl budget sur les fiches produits qui, elles, doivent ranker.
Trois reperes pour lire l'activite des bots dans vos logs.
Reperes illustratifs, a titre pedagogique. Les resultats reels varient selon la concurrence et la qualite editoriale.
- Bloquer Googlebot par erreur dans robots.txt et disparaitre de l'index
- Confondre user-agent declare et bot reel : certains se font passer pour Googlebot
- Laisser les bots gaspiller le crawl budget sur des URL sans valeur
- Ignorer les logs, seule source fiable pour savoir qui explore vraiment le site
Bot avec Hack The SEO
Hack The SEO calcule un GEO Score par page et liste ce qui manque pour etre cite par ChatGPT, Perplexity et les autres IA. Decouvrir le plugin SEO WordPress Hack The SEO.
Termes lies
Questions frequentes
- Comment savoir quels bots visitent mon site ?
- Analysez vos logs serveur : chaque requete indique un user-agent (Googlebot, AhrefsBot, GPTBot). Des outils d'analyse de logs ou la Search Console (pour Googlebot) synthetisent ces visites. C'est la seule facon fiable de voir la frequence de crawl et les pages reellement explorees.
- Faut-il bloquer les bots des IA comme GPTBot ?
- Cela depend de votre strategie. Les bloquer protege votre contenu de l'entrainement, mais reduit vos chances d'etre cite dans ChatGPT ou Perplexity. Beaucoup d'editeurs les laissent passer pour gagner en visibilite GEO. Le choix se fait chemin par chemin dans robots.txt.
- Un bot peut-il ralentir mon site ?
- Oui, un crawl trop agressif ou plusieurs bots simultanes peuvent charger le serveur. Vous pouvez limiter la frequence via robots.txt (Crawl-delay) ou les reglages Search Console. Les bots serieux respectent ces limites ; les bots malveillants s'en affranchissent et se bloquent au niveau serveur.
On en parle ?
Hack The SEO applique tout ca a votre site WordPress, pilote en langage naturel. Reservez 20 minutes, on regarde votre cas ensemble.
Reserver 20 minutes