もどる HexScope Lens

うちの公式サイトより、AIはRedditの口コミを参照してる問題

POINT この記事のポイント
  • AIの引用元トップはReddit、3000万件分析でわかった
  • 本当に効くのは自社発信ではなく他者が語る第三者の場所

「AIにうちの会社のこと聞いたら、なんか知らない情報で答えてきた」

最近、自社の名前をChatGPTに打ち込んで、「うちのこと、どう説明するのかな」と試してみた方、けっこう多いんじゃないですかね。へクス子の周りでも、広報やマーケの担当者が面白半分でやってみて、「なんか古い情報で語られた」「どこかの掲示板の評判をそのまま言われた」とザワついている場面を、よく見かけるようになりました。

で、よくよく聞いてみると、引っかかっているのは情報が古いことそのものじゃないんですよね。「うちの公式サイトにはちゃんと最新情報を載せてるのに、AIはなぜかそっちを見てない」という、参照先のズレのほうが気持ち悪いわけです。

自社できれいに整えたコーポレートサイトより、どこの誰が書いたかわからないネットの書き込みを、AIは優先して引っぱってくる。そんなことが本当に起きているのか。今回は、AIが回答の引用元として「どのサイトを見ているのか」を大規模に調べた集計データを、掘り下げてみたいと思います。

AIの引用元は、ほんの一部のサイトに偏ってる

まず結論から言いますと、AIが回答を作るときに参照している引用元ってのは、想像以上に少数のサイトへ集中しております。Contentlyが2026年に複数の大規模調査を集計した解説(R)を見ると、その偏りっぷりがよくわかるんですよ。

具体的に上位を占めているのは、だいたいこのあたりです。

  • Wikipedia: ChatGPTの全引用の7.8%。さらにChatGPTの学習データの約22%を占めるとも言われる
  • Reddit: Perplexityでは引用の最大5件に1件(約20%)。Peecの分析では主要AIエンジン横断で引用元の堂々1位
  • LinkedIn: ChatGPT Searchの回答の14.3%で引用。Profoundの追跡では2025年11月の11位から2026年2月に5位へ急上昇

並べてみると、共通点が見えてきますね。Wikipediaは百科事典、Redditは匿名の掲示板、LinkedInはビジネス系SNS。いずれも「みんなが書き込む場所」であって、企業がコントロールしている公式サイトではないわけです。へクス子も、AIはもっと公式発表を大事にしているものと思い込んでいたんですが、実態は第三者がわいわい語っている場所のほうを引用元に選びやすい、ということですね。

「その数字、ちゃんとした調査なの?」という話

こういう数字を見ると、「どうせ一部のツールが小規模に測っただけでしょ」と身構える方もいるでしょう。ところが、集計の元になっている研究は、どれもなかなかの規模なんですよ。

  • Peec AIは約3,000万件のソースを分析
  • SEMrushは32.5万件のプロンプトを調査
  • Profoundは140万件の引用を追跡
  • SE Rankingは12.9万ドメインを対象に集計

数十万から数千万という単位で見て、なお「Wikipedia・Reddit・LinkedInが上位」という傾向が共通して出てくるわけです。たまたま少数のサンプルで偏りが出た、という話ではなさそうですなぁ。

ブランドの「言及量」が、引用を呼んでくる

で、ここからがマーケ担当者として一番効いてくる話なんですが、SE Rankingの分析で興味深い相関が出ております。Redditでのブランド言及が多いドメインは、ChatGPTでの引用が平均7件。言及が少ないドメインは平均1.8件。その差、約3.9倍であります。

つまり、AIに引用されるかどうかは、自社がどれだけ立派なページを作ったかよりも、「世間でどれだけ語られているか」に引っぱられている可能性が高いわけですね。コミュニティやSNSでの言及の蓄積が、そのままAIの引用されやすさにつながっている、という構図です。

これは、町の定食屋の評判みたいなものかもしれません。自分で「うちの定食は美味い」と看板を出すより、常連客が「あそこ美味いよ」と言いふらしてくれている店のほうに、新顔の客は吸い寄せられていく。AIの引用も、それに近い動き方をしているわけですね。

AIの「ブランドの見方」は、そもそもクセが強い

引用元が偏っているだけでなく、AIがブランドをどう評価するかにも、もともとクセがあることがわかっています。EMNLP 2024で発表された研究(R)では、複数のAIモデルが高所得国には高級ブランドを88〜100%の確率で推薦するなど、グローバルブランドを過剰にひいきする傾向が報告されたんだそうな。AIは中立な審判ではなく、学習データに含まれる偏りをそのまま映す鏡だ、ということですね。

さらに、SparkToroが2,961回の実行で調べた調査(R)では、AIのブランド推薦リストは99%以上の確率で毎回異なるのに、特定ブランドの「出現率」自体は統計的に安定している、という結果も出ております。1回ごとの答えはブレるけれど、何を引用元にして、どんなブランドを持ち出すかという全体の傾向は、わりと一貫しているわけっすね。

ということは、自社のAI上での見え方を知りたいなら、1回の回答に一喜一憂するより、「AIがどこを引用し、どう語るか」の傾向を継続して見たほうがいい、という話になりますね。

結論: 磨くべきは自社サイトより、「他者が語る場所」

ここまでの集計をまとめると、AI時代のブランド露出は、自社サイトをいくらきれいに整えても、それだけでは足りないわけですね。AIが引用元として頼りにしているのは、Wikipedia・Reddit・LinkedInといった、第三者が語る場所であります。そこでの言及の積み重ねが、そのまま引用のされやすさに直結しているからですね。

だとすると、マーケ担当者がまず考えるべきは、自社サイトの検索順位だけを追いかけるのをやめることになりましょう。大事なのは、「AIが自社をどこから引用し、どんなトーンで語っているか」を定点観測するほうでしょう。

最近はGEOという言葉も出てきましたね。GEOってのは、ジェネレーティブ・エンジン・オプティマイゼーションの略で、要は「AIに引用・推薦されやすくする取り組み」のことです。その第一歩は、自社の順位ではなく、引用元と語り口を把握することからですからね。

見るべきは、たとえばWikipediaやRedditに自社についての言及がきちんと積み上がっているか、そこで語られている自社像が実態とズレていないか、といったあたりでしょう。公式サイトの更新と並行して、第三者の場所で育っていく評判のほうにも、目を配っておきたいところです。AI時代のブランド管理は、そういう発想の切り替えを求めているのかもしれません。


出典

  • Contently (2026), “Top Sources LLMs Cite Most in 2026”, リンク
  • Kamruzzaman et al. (2024), ""Global is Good, Local is Bad?”: Understanding Brand Bias in LLMs”, EMNLP 2024, リンク
  • Rand Fishkin / SparkToro (2026), “AIs are highly inconsistent when recommending brands or products”, リンク
記事一覧にもどる