Générateur de robots.txt

Qu'est-ce que le générateur de robots.txt ?

Cet outil génère le fichier robots.txt pour site web — blocage de bots, URL de sitemap, retard de crawl tous configurés. Fondation du contrôle SEO.

Comment créer robots.txt

Ajoutez règles allow/disallow.
Ciblez bots spécifiques (Googlebot, GPTBot, etc.).
Incluez URL de sitemap.
Établissez crawl-delay (optionnel).
Uploadez fichier sur racine du site.

Règles communes

Permettre tout : User-agent: * + Disallow:
Bloquer bots IA : GPTBot, ClaudeBot disallow
Pages admin : Disallow: /admin/
Sitemap : https://site.com/sitemap.xml
Testez en Google Search Console

Questions fréquemment posées

Qu'est-ce que robots.txt ?

Fichier sur racine du site qui dit aux crawlers web quelles pages crawler, lesquelles non. Les moteurs de recherche respectent (bien que pas exigible). Premier niveau de contrôle SEO.

Quelles sont les règles communes ?

User-agent: * (tous bots). Disallow: /admin/ (panneau admin). Allow: /public/. Sitemap: https://site.com/sitemap.xml. Crawl-delay: 5 (réduit charge serveur). Contrôle complet.

Comment bloquer bots spécifiques ?

User-agent: GPTBot (crawler IA d'OpenAI). Disallow: /. Empêche le contenu du site d'être utilisé en entraînement de LLM. Beaucoup de sites commencent à bloquer bots IA.

Quelles erreurs éviter ?

Disallow: / (bloque tout le site — désastre !). Info sensible (mots de passe) pas en robots.txt — n'importe qui peut le lire. Incluez URL de sitemap — aide en indexation.

Qu'est-ce que le générateur de robots.txt ?

Comment créer robots.txt

Règles communes

Questions fréquemment posées

Outils associés