La base de connaissances d'un chatbot : par où commencer concrètement
Vous voulez ajouter un agent IA à votre site mais vous ne savez pas quoi lui donner à manger. Voici les cinq documents qui doivent y être en priorité, dans l'ordre.
Si vous avez décidé d'ajouter un agent conversationnel à votre site, il y a une étape qui bloque souvent la mise en route. L'outil vous demande de "lui donner sa documentation". Vous regardez les documents que vous avez : la FAQ vieille de deux ans, des fiches produit éparpillées, un guide d'utilisation incomplet, des conditions générales. Par où commencer ?
La réponse n'est pas "tout balancer dedans". Un agent qui reçoit 200 pages de docs disparates répond moins bien qu'un agent qui en reçoit 20 bien choisies. La qualité bat le volume.
Voici les cinq documents à mettre en priorité, dans l'ordre. Si vous suivez cette liste, vous serez à 80% de la qualité de réponse en deux heures de travail.
1. Le tarif détaillé, formaté comme une fiche
C'est la question la plus fréquente sur tous les sites, tous secteurs confondus. Le visiteur veut savoir combien ça coûte, ce qui est inclus, et ce qui change entre les options.
Format à viser : un document court (1 à 2 pages) qui liste vos plans ou tarifs en bullets clairs. Pour chaque plan : le prix, ce qui est inclus, ce qui est limité, et le profil de client recommandé.
Ce qui ne marche PAS bien : un tableau de prix exporté de votre page web sous forme d'image, ou un PDF marketing avec beaucoup de design. Le markdown brut ou le texte simple bat tout.
Astuce : si vous avez une grille tarifaire complexe (tarifs dégressifs, options à la carte), faites une version simplifiée pour l'agent. Trois ou quatre cas typiques expliqués clairement valent mieux qu'une grille technique exhaustive que l'agent va mal interpréter.
2. La FAQ, mais celle des vraies questions
Pas la FAQ marketing qui couvre "comment passer commande" et "quelle est notre politique de retour". La FAQ des vraies questions : celles qui reviennent dans vos mails de support de la semaine.
Méthode rapide : prenez vos 30 derniers mails de support entrants. Pour chaque mail, écrivez la question en une phrase et la réponse en 2-3 phrases. Vous obtenez 30 paires question-réponse en une heure. C'est votre vraie FAQ.
Format à viser : un document markdown avec un titre ## par question, et la réponse dessous en texte clair. L'agent traite chaque question comme une unité distincte, ce qui améliore la qualité de réponse.
Astuce : si la même question revient sous 3 formulations différentes ("c'est combien", "quel est le prix", "ça coûte combien"), ne créez qu'une seule entrée. L'agent moderne sait reconnaître les variations sémantiques. Pas besoin de répéter.
3. La politique de retour / d'annulation, vue du client
Pour les boutiques en ligne et les SaaS avec abonnement, c'est une objection majeure avant l'achat. Le visiteur veut savoir comment il peut faire marche arrière si ça ne lui convient pas.
Important : rédigez ce document du point de vue du client, pas du vôtre. Pas "notre politique de retour est de 30 jours sous réserve de [...]" mais "vous avez 30 jours pour tester. Si ça ne vous convient pas, vous nous écrivez à support@ et on rembourse en 5 jours ouvrés".
Le ton change tout sur la perception du risque. Une politique formelle décrite techniquement bloque. La même règle reformulée en langage client rassure.
4. Une description de votre produit ou service en mode "ce que c'est, ce que c'est pas"
L'objection "je sais pas si c'est pour mon cas" est très fréquente sur tous les sites. Elle vient du fait que vos pages produit décrivent ce que vous faites mais rarement ce que vous ne faites pas.
Document à créer : 1 page qui dit clairement votre cible, vos cas d'usage typiques, et les profils que vous ne servez PAS. Oui, dire ce que vous ne faites pas est contre-intuitif. Mais ça aide énormément l'agent à éviter les faux positifs ("oui ça va vous aller") qui se transforment en clients déçus.
Exemple pour un SaaS de gestion de projet : "Conçu pour les équipes de 3 à 50 personnes qui ont besoin de coordonner leurs projets. Pas adapté aux solos qui veulent une todo list simple, ni aux équipes de 200+ qui ont besoin de gestion de portefeuille avancée."
5. Vos coordonnées et canaux de contact, structurés
Pour toutes les questions que l'agent ne peut pas résoudre (cas très spécifique, demande personnalisée, escalation), il doit savoir vers où orienter le visiteur.
Document à créer : 1 page courte avec :
- L'email de support (et son délai de réponse réaliste)
- Le formulaire de contact si vous en avez un
- Les horaires d'ouverture du support humain
- Les cas où il vaut mieux appeler vs écrire
L'agent moderne sait dire "pour ce cas spécifique, je vous suggère d'écrire à X qui pourra mieux vous aider" SI vous lui donnez ces infos. Sans elles, il invente ou n'oriente pas.
Ce qui ne sert à rien dans la base
Quelques erreurs courantes :
- Vos CGV / CGU complètes. C'est du juridique formel que personne ne lit, et ça pollue les réponses de l'agent qui pioche dedans.
- Vos pages "À propos" marketing. Le ton corporate ne sert pas l'agent à répondre aux vraies questions.
- Vos articles de blog. Sauf si très spécifiques et utiles, ils diluent la qualité de retrieval.
- Vos vidéos transcrites. Le format parlé est trop bavard pour servir de source à un agent. Faites un résumé écrit propre à la place.
L'agent moderne fait du tri intelligent dans ce qu'on lui donne. Mais on l'aide énormément en ne lui donnant que les documents qui doivent vraiment être consultés.
Le format qui marche partout
Markdown, en français, avec des ## pour les sections. Pas de PDF si vous pouvez l'éviter (l'extraction de texte depuis un PDF perd souvent la structure). Pas de tableaux complexes. Phrases courtes. Réponses directes.
Si vous avez du contenu existant dans Google Docs ou Notion, exportez-le en markdown et nettoyez-le rapidement avant de l'uploader. 30 minutes de nettoyage par document valent 3 heures de tuning de l'agent ensuite.
L'erreur classique à éviter
Je vois souvent des entreprises qui uploadent l'ensemble de leur Notion interne (200 pages, dont 70% de notes internes obsolètes) et se plaignent que l'agent répond mal.
L'agent répond comme la qualité de ses sources. Document obsolète, agent qui hallucine. Document interne pas formaté pour un client externe, agent qui parle dans des termes incompréhensibles. Documents contradictoires (deux pages qui disent des prix différents), agent qui pioche dans la mauvaise.
Le ratio idéal est 80% de qualité, 20% de quantité. 5 documents propres et à jour battent 50 documents vrac.
L'exercice de cette semaine
Bloquez 2 heures dans votre agenda. Créez un dossier kb-chatbot/ sur votre ordinateur. Mettez-y les 5 documents listés ci-dessus, dans l'ordre. Pour chacun, faites une version markdown propre, en langue de votre client, en 1-2 pages.
À la fin des 2 heures, vous aurez 5-10 pages de contenu de qualité, prêtes à être uploadées dans n'importe quel outil de chatbot moderne. C'est la base. Le reste, vous l'enrichissez en fonction des questions que l'agent ne sait pas répondre lors des deux premières semaines.
C'est moins de boulot que vous ne pensez. Et ça change radicalement la qualité du résultat.