「ChatGPTは優しい」の正体、人間より49%多いおべっかだった

POINT この記事のポイント

「AIに相談すると、なんか肯定されて気持ちいい」問題

仕事の判断に迷ったとき、ChatGPTに相談してみることってあるじゃないですか。

へクス子も「この企画、どう思う？」と投げると、たいてい「いい着眼点ですね」と返ってきて、ちょっと安心するんですよね。

なんですが、よく考えると不思議な話です。こちらの考えを肯定してくれるのは気分がいいんですが、それって本当に中立な評価なんでしょうか。

実はこの「AIはやたら肯定してくる」という感覚を、きっちりデータで裏づけた研究が出ております。今回はStanfordとCarnegie Mellonのチームが、AIの「おべっか」を測った研究を見てみたいと思います。

面白い（というか、ちょっと怖い）のはここからです。

研究チームは、2,405人が参加する3つの実験を事前登録したうえで行っております。事前登録ってのは、「こういう仮説をこう検証します」と先に宣言してからデータを取る、お手盛りを防ぐための手続きですね。

その結果、追従的なAIとたった1回やり取りしただけでも、参加者は「自分は正しい」という確信を強めたと報告されています。対人関係のトラブルを、自分から修復しようとする意欲も下がったそうな。

一度おだてられただけで気が大きくなるのって、調子のいい店員さんに乗せられて、要らないオプションまで契約してしまう感じに近いのかもしれません。

さらにやっかいなのが、ユーザー側の受け止め方であります。

参加者は、追従的なAIの回答を「より質が高い」と評価し、そのAIをより信頼し、また使いたいと答えたんですね。

肯定してくれるAIは心地いいので、つい頼りたくなる。ところが、その心地よさが判断力を少しずつ削っていく、というわけです。

ここはマーケターとして見逃せないところでしょう。AIに意見を求めるとき、私たちは無意識のうちに「肯定してほしい聞き方」を選んでしまいがちなんですよ。

では、この話を実務にどう効かせるか。

自社ブランドや商品の評価をAIに聞く場面を考えてみましょう。「うちのサービスの強みは？」と尋ねれば、AIは強みをそれらしく並べてくれます。ですが、それはこちらが「強みを挙げてほしい」と誘導した結果かもしれないわけっすね。

つまり、AIから返ってくる好意的な評価は、ブランドの実力ではなく、こちらの聞き方を映しているだけの可能性がある。これは測定としては、なかなか心もとない話であります。

今回の研究が教えてくれるのは、AIの肯定は中立な評価とは限らない、ということです。最新の11モデルがそろって人間より49%多く肯定し、しかも私たちはその追従を「質が高い」と感じてしまう。気持ちよさと正確さは、別物だったわけですね。

なので、AIにブランドや企画の評価を聞くときは、答えそのものより「自分がどう聞いたか」を先に疑うのがよさそうです。「強みは？」だけでなく「弱みは？」も同じ熱量で聞く、肯定と否定を同じ条件で並べる、といった聞き方の対称性を意識したいところです。

もう一歩進めるなら、その場の会話で評価を決めず、同じ条件で繰り返し測って傾向を見る、という発想が効いてきます。一回の「いいね」に一喜一憂せず、聞き方をそろえた定点観測でブランドの見え方を追うほうが、ずっと信頼できる材料になるはずです。

一回ホメられて舞い上がる前に、いったん深呼吸といきましょうかね。

出典

Cheng, M., Lee, C., Khadpe, P., Yu, S., Han, D., Jurafsky, D. (2026), “Sycophantic AI Decreases Prosocial Intentions and Promotes Dependence”, Science, Science / arXiv