Crawler d'Anthropic dédié à l'entraînement des modèles Claude. Fait partie d'une famille de quatre crawlers documentés (ClaudeBot pour training, Claude-SearchBot pour search, Claude-User pour fetch utilisateur, claude-code pour CLI dev). Tous respectent robots.txt et n'exécutent pas JavaScript.

Les quatre crawlers Anthropic

User-AgentRôle
ClaudeBotTraining des modèles Claude
Claude-SearchBotIndexation pour Claude Web Search (depuis mars 2025)
Claude-UserFetch déclenché par un utilisateur dans une conversation
claude-codeCLI développeur (Claude Code)

Note : anthropic-ai est l’ancien user-agent historique, encore présent dans certains configs.

Comportement

TraitDétail
Respecte robots.txtOui (tous)
Exécute JavaScriptNon
Web search disponibleMars 2025 (payants), mai 2025 (gratuits)

Sources favorites de Claude

Très research-oriented. Préfère .edu, papers académiques, GitHub, Stack Overflow, journalisme legacy (NYT, Atlantic, Economist). Seulement 36 % des citations journalistiques de moins d’un an chez Claude (vs 56 % chez ChatGPT). Claude valorise la profondeur sur la fraîcheur.

Actions prioritaires côté marchand

  • Documentation technique exhaustive.
  • Contenu long-form analytique.
  • Citations académiques.
  • Intégration [[mcp]] pour B2B SaaS (Stripe, Linear, Notion l’ont fait).

Configuration recommandée

Si vous voulez la citation immédiate (sans entraîner Claude) :

User-agent: Claude-SearchBot
User-agent: Claude-User
Allow: /

User-agent: ClaudeBot
User-agent: anthropic-ai
Disallow: /

Volumes observés

Sur un panel de boutiques DTC françaises 1 à 10 M€ en avril 2026, ClaudeBot représente en moyenne 0,3 à 0,8 % du trafic crawl total, loin derrière Googlebot (40 à 55 %) et GPTBot (1 à 3 %). Claude-SearchBot reste plus discret encore (0,1 % en moyenne) mais sa courbe est en croissance mensuelle régulière depuis le lancement de Claude Web Search payant en mars 2025.

Vérification d’authenticité

Les IP de ClaudeBot sont publiées par Anthropic sous forme de plages CIDR signées. Un reverse DNS lookup sur une requête prétendument ClaudeBot doit résoudre vers *.anthropic.com. Tout user-agent ClaudeBot venant d’une IP qui ne reverse pas correctement est un faux et peut être bloqué sans risque de pénalité.

À ne pas confondre avec

  • [[gptbot]] : crawler OpenAI, indépendant.
  • claude-code : crawler du CLI développeur Claude Code, à autoriser si vous publiez de la doc technique destinée aux développeurs.

Sources et références

Auditer ma boutique

L'audit est gratuit. Réponse sous 48 h ouvrées. Pas d'engagement.