同じAI推薦リストは1%未満、だから順位より出現率で見る話

POINT この記事のポイント

高可視性ブランドは97%出現、出現率は反復で再現するらしい
AIに覚えられるかはカテゴリ文脈の一貫性で決まる話

#AI Visibility
#ブランド想起
#AI推薦
#GEO
#プロンプト

AIに「覚えられるブランド」って何なんですかね？

最近は「検索で上位に出るか」だけでなく、「ChatGPTやClaudeにおすすめされるか」を気にする企業が増えてきました。

ユーザーがAIへ質問するなら、そこで名前が出るかどうかは、確かに大事ですよね。へクス子も「うちは候補に出るんでしょうか」という相談をよく受けます。ただ、ここでちょっとだけ立ち止まりたいんですよ。

AIは人間みたいに、「昨日見た広告の印象」でブランドを推すわけではありません。「タグを入れれば記憶される」みたいな、単純なSEO裏技とも別物でしょう。

AIにとってのブランド想起ってのは、特定カテゴリの問いへ自然に結びつくか、という問題です。つまり「1回で何位か」より、「同じ意図の質問群で、どれくらい候補に入り続けるか」が本丸なんですよね。

個別の推薦リストは、ほぼ毎回変わる

まず押さえたいのが、SparkToro と Gumshoe の調査です（R1）。600人のボランティアが、ChatGPT・Claude・Google AI へ、B2C/B2B の12種類のプロンプトを合計2,961回実行しています。

衝撃的だったのは、**同じ推薦リストは1%未満、順序の一致は約0.1%**という点です。つまり「今日は3位だった」は、ほぼ単発のノイズなんですよ。翌日に同じ質問をすれば、普通に並びは変わります。

ただ、ここで話が終わらないのが面白いところでして。個別の順位は揺れる一方で、Visibility%（出現率）は統計的に安定していたそうな。高可視性ブランドは71回中97%出現し、SaaSでも55〜77%の出現率が確認されています。

1回の答えはブレる。でも反復すると「よく出るブランド」はちゃんと見えてくるわけですね。この示唆は、実務的にかなり大きいです。「覚えられているか」を見るなら、単発の画面ではなく出現率を見る。サイコロを1回振って性質を決めるようなもので、単発観測だと、測り方のほうが先に間違うわけです。

AIは「言い方」より「問いの構造」に反応する

次に気になるのは、「言い方を変えたら、結果も全部変わるのか？」です。AI可視性の測定では、この不安がけっこう大きいですよね。参考になるのが、Errica らの感度研究です（R2）。

ここでは、言い換えへの反応を「感度」と「一貫性」で測っています。結果として、パラフレーズによる精度変動は3.2%〜10%に収まっていました。

ゼロではないけれど、言い方だけで世界がひっくり返るほどでもない。むしろ、何をどのカテゴリ課題として聞くか、という意味構造のほうが効きやすいわけですね。

SparkToro にも、響き合う結果があります。142のクラフトプロンプトは、類似度0.081と低めでした。それでも回答は、似たブランド集合へ収束したそうな。言い方がバラバラでも、問いが同じカテゴリなら、候補群はちゃんと寄ってくる。つまり「覚えられる」とは、魔法の文言ではなく、カテゴリの意味構造との結びつきだ、ということですなぁ。

「覚えられやすさ」は情報の厚みで決まる

もうひとつの補助線が、Stanford/DeepMind の「Generative Agent Simulations of 1,000 People」です（R3）。

1,052人への質的インタビューをもとに、「その人っぽく答えるAI」を作った研究ですね。このエージェントは、GSS回答で、本人の2週間後再回答を基準に85%再現したと報告されています。

重要なのは、薄い属性だけで作っていない点です。生活背景や価値観まで入れたからこそ、「本人っぽさ」が出ているわけですよ。

この話をそのままブランドへ直結させるのは、ちょっと慎重さが要ります。人間の態度の再現と、ブランド推薦は別タスクですからね。ただ、示唆は近い。「それっぽさ」には、単発のキーワードより、文脈の厚みが効く可能性が高いんですよね。

つまり、1回の自己紹介より、カテゴリ上で何を解くブランドなのかを、複数の情報源で一貫させるほうが重要なわけです。AIが参照する場所ごとに説明が割れていると、候補集合そのものが散ってしまいます。

「AIに覚えられるか」は2つの運用で判断する

AIにブランドが覚えられているかは、1回の順位ではなかなか判断できません。同じ意図の質問を繰り返したときに、どれくらいの頻度で出るのか、どんなに入るのか。そこを見るほうが、ブランド想起に近い読み方になります。

運用では、反復測定の出現率を見ながら、公式サイト、比較記事、レビューでカテゴリ文脈をそろえていくのが大事です。「誰向けに、どの課題を解くブランドか」が割れていると、AI側の想起もそのまま不安定になります。つまり、AIに覚えられる施策は、単発のプロンプト対策ではなく、ブランドの説明を一貫させる地道な仕事なんですよね。

AI可視性の測定設計まで含めて見直したい方は、AI可視性ツールは「順位より出現率」を見れば外しにくい話もあわせて読むと、判断軸がそろいます。

出典

Rand Fishkin (SparkToro/Gumshoe), “NEW Research: AIs are highly inconsistent when recommending brands or products; marketers should take care when tracking AI visibility”, 2026-01-27, link
Federico Errica, Giuseppe Siracusano, Davide Sanvito, Roberto Bifulco, “What Did I Do Wrong? Quantifying LLMs’ Sensitivity and Consistency to Prompt Engineering”, NAACL 2025, arXiv:2406.12334, link
Joon Sung Park et al. (Stanford University, Google DeepMind), “Generative Agent Simulations of 1,000 People”, arXiv:2411.10109, 2024, link