« J’ai demandé à l’IA ce qu’elle disait de ma boîte, et elle a inventé »
Vous l’avez sûrement déjà fait. On tape le nom de sa marque dans ChatGPT, et on lui demande ce qu’elle raconte sur nous.
Et la réponse revient un peu de travers. Un détail périmé. Un commentaire de forum répété comme si c’était un fait.
Mais ce qui agace vraiment, ce n’est pas que l’info soit vieille.
Le plus gênant est ailleurs : votre site contient la bonne version, et l’IA n’est tout simplement pas allée la voir. Le problème, c’est l’endroit où elle regarde.
Est-ce que ça arrive pour de vrai ? L’IA ignore-t-elle votre belle page corporate pour aller pêcher un message anonyme ? Regardons les chiffres. Parce que quelqu’un a fini par mesurer tout ça à grande échelle.
Où l’IA va-t-elle vraiment chercher ?
L’idée centrale d’abord : les sources sur lesquelles l’IA s’appuie sont bien plus concentrées qu’on ne l’imagine.
Une synthèse de Contently parue en 2026 rassemble plusieurs grandes études. Et le déséquilibre saute aux yeux.
Tout en haut, on retrouve toujours les trois mêmes noms.
- Wikipédia : 7,8 % de toutes les citations de ChatGPT. Et sans doute 22 % de ses données d’entraînement.
- Reddit : jusqu’à une citation sur cinq chez Perplexity (environ 20 %). Et la source la plus citée tous moteurs confondus, selon Peec.
- LinkedIn : cité dans 14,3 % des réponses de ChatGPT Search. Une montée rapide : de la 11e place en novembre 2025 à la 5e en février 2026, d’après Profound.
Vous voyez ce qui les relie ? Wikipédia est une encyclopédie, Reddit un forum anonyme, LinkedIn un réseau professionnel. Aucune de ces pages ne vous appartient.
Ce sont des endroits où ce sont les autres qui écrivent. Moi aussi, je pensais que l’IA donnerait plus de poids aux communiqués officiels. Eh bien non. Elle va vers les lieux où des tiers discutent.
« Et ces chiffres, ils sont fiables ? »
Bonne question. Devant ce genre de statistiques, le réflexe est de se dire qu’un outil a mesuré un échantillon minuscule et l’a vendu comme une tendance.
Mais les études derrière sont énormes.
- Peec AI a analysé près de 30 millions de sources.
- SEMrush a examiné 325 000 requêtes.
- Profound a suivi 1,4 million de citations.
- SE Ranking a agrégé 129 000 domaines.
Des centaines de milliers, des millions de points de données. Et le même schéma ressort à chaque fois : Wikipédia, Reddit et LinkedIn en tête.
Ce n’est donc pas le hasard d’un petit échantillon.
Ce qui déclenche la citation, c’est qu’on parle de vous
Et voici la partie qui compte le plus quand on fait du marketing.
SE Ranking a trouvé une corrélation frappante. Les domaines très mentionnés sur Reddit obtenaient en moyenne 7 citations dans ChatGPT. Ceux peu mentionnés, 1,8. Un écart d’environ 3,9 fois.
Autrement dit : que l’IA vous cite dépend moins de la beauté de vos pages que du nombre de fois où l’on parle de vous ailleurs.
Les mentions s’accumulent dans les communautés et sur les réseaux. Et c’est ce tas-là qui vous rend citable.
Pensez au petit resto du coin. On peut afficher « meilleur menu du quartier » sur sa devanture toute la journée. Mais le nouveau client pousse la porte de celui que les habitués recommandent. Les citations de l’IA fonctionnent pareil.
L’IA a déjà une vision biaisée de votre marque
Et il n’y a pas que l’endroit où elle regarde. La façon dont l’IA juge une marque comporte aussi un biais d’usine.
Une étude présentée à l’EMNLP 2024 a montré que plusieurs modèles d’IA recommandent des marques de luxe aux pays à hauts revenus dans 88 à 100 % des cas. Un favoritisme net pour les grands noms mondiaux.
L’IA n’est pas un arbitre neutre. C’est un miroir du déséquilibre logé dans ses données.
Il y a un détail encore plus curieux. SparkToro a réalisé 2 961 essais et a constaté que la liste des marques recommandées change à plus de 99 % à chaque fois. Mais le taux d’apparition d’une marque donnée, sur l’ensemble des essais, reste statistiquement stable.
Qu’est-ce que ça veut dire ? Qu’une réponse isolée n’est que du bruit. La tendance de fond — ce qui est cité, quelles marques ressortent — est plutôt constante.
Et on en tire une conséquence pratique. Pour savoir comment vous apparaissez dans l’IA, ne vous focalisez pas sur une réponse. Regardez la tendance dans le temps.
Le vrai travail ne se joue pas sur votre site
Pour résumer : à l’ère de l’IA, soigner son site ne suffit plus à lui seul.
Les sources auxquelles l’IA fait confiance sont les lieux tiers — Wikipédia, Reddit, LinkedIn. Et ce sont les mentions empilées là-bas qui nourrissent les citations.
Le premier geste, en marketing, c’est donc d’arrêter de fixer uniquement son classement Google. Ce qui mérite qu’on le surveille, c’est d’où l’IA vous tire, et sur quel ton elle en parle.
Vous avez sûrement entendu parler du « GEO ». Le GEO, c’est la Generative Engine Optimization — en clair, le travail pour être cité et recommandé par l’IA. Et la première étape, ce n’est pas votre classement : c’est de connaître vos sources et le récit qu’on fait de vous.
Regardez si votre marque se construit vraiment sur Wikipédia et Reddit. Et si l’image peinte par ces endroits colle à la réalité.
Continuez à mettre votre site à jour, bien sûr. Mais ne quittez pas des yeux la réputation qui grandit là où vous n’êtes pas chez vous.
La gestion de marque à l’ère de l’IA, c’est avant tout déplacer son attention.
Sources
- [R1] Contently (2026), « Top Sources LLMs Cite Most in 2026 ». Contently
- [R2] Kamruzzaman et al. (2024), « Global is Good, Local is Bad?: Understanding Brand Bias in LLMs », EMNLP 2024. ACL Anthology
- [R3] Rand Fishkin / SparkToro (2026), « AIs are highly inconsistent when recommending brands or products ». SparkToro