Quand ChatGPT cite des sources… qui n’existent pas
Sébastien vous recommande de consulter notre guide gratuit pour faire décoller vos affaires en ligne.
Télécharger le guide
Les modèles de recherche et de génération d’IA promettent des citations fiables. Sur le terrain, c’est parfois l’inverse : liens 404, sources inventées, bibliographies incohérentes… Dans cet article, je partage un cas réel en YMYL (finance), j’explique pourquoi c’est critique pour la confiance et le SEO, et je propose des garde-fous pragmatiques pour publier sans risque.
Ce que nous allons voir dans cet article.
- Un retour d’expérience concret avec des citations IA qui mènent à des 404… facturées.
- Pourquoi ces erreurs sapent la confiance utilisateur et le SEO (surtout en YMYL).
- Les étapes de contrôle à intégrer avant publication (check technique & éditorial).
00:29
Peut-on encore croire aux citations IA ?
On nous répète que l’IA s’améliore à chaque nouvelle version. Plus fiable, plus précise, plus “humaine”. Mais qu’en est-il vraiment ?
Ces dernières semaines, j’ai plongé dans un cas concret avec une automatisation SEO. Et ce que j’ai découvert ressemble moins à un progrès qu’à une régression inquiétante.
Spoiler : ça m’a coûté 20 $ le million de tokens… pour des 404.
Mon expérience terrain
Le contexte est simple : un client YMYL dans la finance, avec de très belles positions dans les SERP.
Ici, pas question d’approximation. L’objectif était de renforcer ses contenus avec des liens vers des sources solides, fiables, crédibles. En SEO, c’est une évidence.
Pas une astuce de geek, pas une mode : c’est le socle de la confiance, aussi bien pour les lecteurs que pour Google.
Et ce n’est pas moi qui le dis, c’est Google lui-même : dans ses Search Quality Evaluator Guidelines ↑, il est précisé que les pages YMYL doivent s’appuyer sur des sources vérifiables et autorisées.
J’ai donc pris mon process habituel : découper le texte, lancer trois SearchGPT pour obtenir des références croisées, et contrôler que tout tienne debout. Sur le papier, ça devait donner un contenu béton.
Dans la pratique ? J’ai eu droit à des liens morts, des sources répétées comme si elles étaient différentes, et même des citations qui ne correspondaient pas du tout au contenu de la page indiquée.
Le pire, c’est que cette gymnastique a un prix : 20 $ le million de tokens. Autant dire que payer pour des 404, ça pique.
La désillusion face à GPT-5
Depuis des mois, on nous promet que GPT-5 corrige ces dérives.
“Plus fiable, plus précis”, dit le discours officiel.
Mais dans la réalité, je constate une régression.
À tel point que j’ai dû ajouter une boucle de vérification supplémentaire pour télécharger chaque source, vérifier que la page existe, que le contenu correspond bien à ce qui est cité, et que le sujet n’a pas été détourné.
Bref, j’ai dû mettre en place une usine à gaz pour compenser les failles de GPT Search. Et honnêtement, ce n’était pas censé être son rôle ?
Est-ce que je suis le seul ?
Par curiosité, j’ai fouillé un peu. Et non, je ne suis pas le seul à vivre ça.
Au contraire, la recherche confirme que le problème est massif.
Un article publié dans Nature en septembre 2025 rappelle que même GPT-5 continue d’inventer des références ↑.
Une étude sur arXiv en juin 2025, “The Attribution Crisis”, a audité près de 14 000 réponses données par GPT, Gemini et Perplexity.
Résultat : jusqu’à 99 % des sources consultées ne sont jamais citées ↑.
Le Tow Center for Digital Journalism a montré que sur 200 tests, plus de 70 % des citations générées étaient inexactes ou incomplètes ↑.
Déjà en 2024, Nieman Lab pointait que ChatGPT générait des URL factices pour des médias partenaires officiels ↑.
Ce n’est pas un bug marginal. C’est une tendance lourde. Et elle touche directement l’écosystème de l’information.
Pourquoi c’est grave
On pourrait se dire : “Bon, un lien mort, ce n’est pas si dramatique.” Mais en réalité, ça change tout.
Un utilisateur qui clique et tombe sur une 404 perd confiance dans le contenu. Un moteur de recherche qui évalue une page avec des références erronées dégrade sa perception de la fiabilité.
Et plus largement, si les IA se nourrissent du web sans jamais créditer les sources, c’est tout un modèle économique qui s’effondre.
Celui de l’information, du SEO, de la confiance numérique.
Sans parler du risque juridique dans les domaines sensibles comme la finance, la santé ou le droit.
Alors, que faire ?
Évidemment, je ne publie pas ces résultats bruts. J’ai mis en place des garde-fous, des vérifications, une validation systématique.
C’est du temps, c’est de l’énergie, mais c’est la condition pour livrer du travail fiable.
En d’autres termes, l’IA est devenue pour moi un brouillon accéléré, pas un moteur de vérité. Et c’est à nous, professionnels, de compenser ses manques pour éviter de tout faire reposer sur un château de cartes.
Conseil pratique : avant publication, validez la disponibilité de la page, la pertinence du passage cité, la cohérence du titre et la date de mise à jour. Un simple script de vérification ou une checklist éditoriale robuste vous épargnera des sueurs froides.
Conclusion
La question qui me reste en tête est simple : si on ne peut pas faire confiance aux citations générées par l’IA, qu’est-ce qu’il reste vraiment de la promesse de “l’IA qui comprend tout” ?
Je commence à me dire que l’IA, aujourd’hui, n’est pas tant un oracle qu’un assistant brouillon, rapide, mais à surveiller de près.
Et peut-être que la vraie maturité n’est pas d’attendre qu’elle devienne parfaite, mais de construire dès maintenant les garde-fous qui permettront de travailler avec elle sans aveuglement.
L’IA peut aider, oui.
Mais pas sans un regard humain pour vérifier, corriger, et surtout… rappeler que la vérité ne se fabrique pas à coups de tokens.
Liens externes à consulter :
- Google - Search Quality Evaluator Guidelines ↑ 2. Nature (septembre 2025) - Can researchers stop AI making up citations? ↑ 3. arXiv (juin 2025) - The Attribution Crisis in LLM Search Results ↑ 4. Tow Center for Digital Journalism - Étude sur les citations IA ↑ 5. Nieman Lab (2024) - ChatGPT hallucine des URL même pour ses partenaires médias ↑
Démarrez avec Kōeki
Gagnez du temps pour
votre e-Commerce.
Vous allez enfin pouvoir prendre de la hauteur stratégique.

