もどる HexScope Lens

AIに「おすすめブランド」を聞くと、出身地で9割も偏ってた不思議

POINT この記事のポイント
  • 高所得国には高級ブランドを88〜100%で推薦してた実験結果
  • 地元・新興ブランドほどAIに推されにくい構造があるという話

「AIにおすすめを聞くと、なんで毎回あの海外ブランドばっかりなの?」

最近、ちょっといいものを買おうとして「ChatGPTにおすすめを聞いてみるか」となる場面、増えてきたじゃないですか。スニーカーでも、化粧品でも、家電でも、検索する代わりにAIへ「予算このくらいでいいのある?」とぶつける人を、よく見かけるようになりました。

で、その回答をじっくり眺めていると、出てくる名前がなんとなく海外の有名どころに寄ってる気がしませんか。へクス子も何度か試してみたんですが、国内の良いブランドを差し置いて、毎回グローバルな大手の名前ばかりが並ぶんですよね。

「まあAIは物知りだから、フラットに良いものを選んでくれてるんでしょう」と思いたくなるところです。ところが、どうやらそう単純な話でもないらしいんですよ。

この「AIのおすすめは本当に中立なのか」という疑問に、4つのAIを使って正面から切り込んだ研究がありまして、今回はそのへんを、じっくり掘り下げてまいりましょう。

4つのAIに「どのブランドがいい?」と聞き続けた研究

自然言語処理の国際会議EMNLP 2024で発表された研究(R)が、まさにこのテーマを扱っておりまして、Kamruzzamanらの研究チームが、GPT-4o、Llama-3、Gemma、Mistralという4つのLLMにブランド推薦をさせて、その偏りを分析したんだそうな。

LLMってのは、要は「大量の文章を読み込んで、それらしい答えを返すAI」のことです。ChatGPTの中身もこれですね。研究では、このAIたちに靴・衣類・飲料・エレクトロニクスといった身近なカテゴリで、国を変えながら「この国の人におすすめのブランドは?」と繰り返し聞いていったわけです。

着目したのは、おおむね次の3点でした。

  • 経済的に豊かな高所得国向けと、低所得国向けで、おすすめがどう変わるか
  • 高級ブランドと、普段使いのブランド、どちらを推してくるか
  • グローバルに有名なブランドと、その土地のローカルブランド、どちらを選ぶか

結果は「露骨なまでの格差」だった

で、結果がどうだったかと言いますと、これがなかなか露骨だったんですよ。

全モデルが、グローバルブランドを「良いもの」と不均衡に結びつけていた

具体的な数字を並べると、こうなります。

  • 高所得国の人には、高級ブランドを**88〜100%**の確率で推薦
  • 低所得国の人には、非高級ブランドを**84〜98%**の確率で推薦
  • 特にGemmaは極端で、高所得国にはほぼ全カテゴリで**100%**高級ブランドを提示

つまり、同じ「おすすめ教えて」でも、相手の国が豊かか貧しいかで、AIの口から出てくるブランドの格がくっきり変わったということですね。商品そのものの質ではなく、聞かれた相手の所得水準で答えを切り替えていたわけです。

なんでAIは「海外=良い」と思い込んでるのか

じゃあ、なんでこんな偏りが生まれるのか。これはAIに悪気があるというより、学習したデータの中身がそのまま顔を出している、というのが実態なんですよね。

AIは世界中のテキストを読んで賢くなるわけですが、そのテキストの世界では、もともとグローバルな大手ブランドのほうが圧倒的に多く語られ、しかも好意的に扱われています。ローカルな新興ブランドは、そもそも言及される量が少ないですからね。

AIはその偏りを「世の中の常識」として吸い込んで、そのまま再生産しているということですね。いわば、ネットの口コミだけを丸暗記して「これが世間の総意です」と胸を張る新人くらい、危なっかしい状態であります。

ただ、話はそう一方的でもありません。研究では「原産国効果」も観察されております。

原産国効果ってのは、「この製品はその国の名産だ」という文脈があると、ローカルブランドのほうが選ばれやすくなる現象のことです。「ドイツの車」「日本の包丁」のように土地と結びついた強みがある場合は、ローカルにも勝ち目が残るわけですね。とはいえ、それは限られた場面の話で、全体としてはグローバル偏重が支配的だった、というのがこの研究の見立てでしょう。

結論: 自社のAI上の評価は「実力だけ」では決まらない

ここまでをまとめると、AIのブランド推薦には、商品の実力とは別に、出身地やグローバルな知名度というバイアスがしっかり乗っている、ということになりましょう。

これがマーケターやブランド担当にとって何を意味するか。「自社がAIにどう語られているか」は、商品やサービスの良し悪しだけでは決まらない、ということです。とりわけ国内中心のブランドや、立ち上げて間もない新興ブランドほど、AIの中では構造的に不利な側に置かれやすい。実力で上回っていても、AIの口からは名前が出てこない、という事態が普通に起こりうるわけですね。

では、どうするか。やることはそれほど難しくありません。まずは自社の主要なカテゴリについて、ChatGPTなどに「おすすめは?」と何度か聞いてみて、自社の名前がどのくらいの頻度で出てくるかを、実際に数えてみることです。

「うちは有名だから大丈夫」と感覚で判断せず、出てくるか出てこないかを自分の目で確かめる。バイアスが乗っているという前提に立てば、AI上の見え方は「測って初めて分かるもの」だと腹落ちするんじゃないでしょうか。

そのうえで、もし思ったより名前が出てこないなら、それはブランド力そのものの問題というより、AIが参照する情報の中で自社の存在感が薄いサインだと考えられます。一度きりの確認で慌てず、定点で測り続けて変化を追いかける。AIのおすすめを「中立な審判」と思い込むのは、まだちょっと早いのかもしれませんな。


出典

  • Kamruzzaman, M., Nguyen, H.M. & Kim, G.L., ""Global is Good, Local is Bad?”: Understanding Brand Bias in LLMs”, EMNLP 2024, リンク
記事一覧にもどる