Indietro HexScope Lens

Inseguire la posizione su ChatGPT è inutile (guardate le presenze)

POINT この記事のポイント
  • 2.961 query: le singole posizioni non si sono quasi mai ripetute
  • Conta solo il tasso di presenza misurato a ripetizione

La dashboard è bella, ma quei numeri reggono?

Aprite la dashboard di uno strumento di «AI Visibility». Numeri ovunque, grafici puliti, una posizione precisa per il vostro marchio dentro le risposte di ChatGPT. Rassicurante, no?

Peccato che, rifacendo la stessa domanda all’AI cinque minuti dopo, quella posizione sia con ogni probabilità già cambiata. Ed ecco il dubbio che ogni marketer onesto si è posto almeno una volta: questo numero serve davvero a decidere qualcosa, o è soltanto bello da guardare?

Il dubbio, va detto subito, è più che legittimo. L’AI Visibility (cioè la misura di quanto e come un marchio compaia nelle risposte degli assistenti come ChatGPT, Claude o Gemini) è un territorio nuovo. E nei territori nuovi gli strumenti arrivano sempre prima dei criteri per giudicarli. Il rischio è leggere ogni numero allo stesso modo, quando alcuni sono segnale e altri puro rumore.

Mettiamo allora in fila tre ricerche indipendenti e proviamo a separare le due categorie: le cifre di cui ci si può fidare e quelle da maneggiare con le molle.

2.961 domande, una scoperta scomoda

SparkToro ha condotto l’esperimento più ampio sul tema: 600 volontari hanno rivolto a tre diverse AI un totale di 2.961 query di raccomandazione di marchi e prodotti. Due numeri, usciti da quei dati, meritano la cornice.

  • La stessa lista di marchi si è ripresentata identica meno dell’1% delle volte; l’ordine esatto ha coinciso in circa lo 0,1% dei casi.
  • Il «tasso di presenza» (quante volte su N un marchio è comparso, a prescindere dalla posizione) si è invece rivelato stabile.

Cosa ci dicono questi numeri? Che la posizione di un singolo giro è, in pratica, rumore. Oggi terzo, domani settimo, dopodomani fuori dalla lista: registrare quelle cifre con aria seria equivale a tenere il diario dei risultati di un lancio di dadi. Il tasso di presenza, al contrario, è un segnale vero. Un marchio ad alta visibilità che compare nel 97% dei casi (su 71 misurazioni) offre una base solida per un confronto mese su mese. Quella sì che si può mettere in un grafico!

I «prompt stimati» non sono da buttare (a una condizione)

L’analisi di Otterly AI aggiunge un tassello. I prompt reali degli utenti contano in media 15,1 parole, quelli stimati dagli strumenti appena 8,8. La differenza non è da poco: le domande vere portano più contesto e più sfumature personali, mentre quelle stimate tendono a essere corte e con un taglio commerciale.

E allora i prompt stimati vanno cestinati? Non così in fretta! Perché la classifica relativa dei marchi — chi sta davanti a chi — risultava «molto simile» nei due casi. In altre parole: il prompt stimato non fotografa la realtà esatta, però per farsi un’idea di massima di dove ci si colloca rispetto ai concorrenti può ancora servire.

Il «volume di ricerca dei prompt»: preciso solo all’apparenza

C’è poi un indicatore da guardare con sospetto, ed è il «volume di ricerca dei prompt». La rassegna critica di jaeckert-odaniel.com solleva un’obiezione netta: i numeri sembrano precisi al decimale, ma il terreno su cui poggiano è probabilmente storto.

  • I dati di partenza pendono verso il desktop e il browser Chrome, e così perdono per strada gran parte dell’uso da mobile.
  • Il panel di utenti è sbilanciato verso il pubblico tech, e la rappresentatività (quanto cioè il campione rispecchi davvero il mercato intero) ne esce ammaccata.
  • L’estrapolazione da campioni piccoli accumula errore su errore, fino a una precisione soltanto apparente.

Un indicatore così va benissimo per costruire ipotesi. Ma promuoverlo a KPI principale per decidere dove spostare il budget? Qui la prudenza è d’obbligo.

Cosa guardare per primo: le ripetizioni, non la posizione

Quando si apre uno strumento di AI Visibility l’occhio corre subito alla posizione e ai punteggi. Eppure le prime due cose da verificare sono altre: su quante ripetizioni si fonda quel numero, e come viene definito il tasso di presenza. Se questi due punti restano nel vago, non importa quanto sia elegante la dashboard — la decisione che ne ricaviamo poggia sul nulla.

Lo strumento pubblica la propria metodologia, come fa SparkToro? Si fonda almeno su qualche decina di misurazioni ripetute? Sono queste le domande da porre. Il valore assoluto del «volume di ricerca dei prompt», invece, è meglio non promuoverlo a KPI: tenetelo come indicatore di supporto, da leggere insieme ai trend di posizione e ai dati di prima mano. Insomma, la dashboard migliore non è quella con più numeri, ma quella che dichiara onestamente da dove vengono.


Fonti

  • Rand Fishkin (SparkToro/Gumshoe), “NEW Research: AIs are highly inconsistent when recommending brands or products”, 27/01/2026, sparktoro.com
  • Thomas Peham (Otterly AI), “Real vs Estimated Prompts: I Analyzed 100s of Real ChatGPT Queries”, 03/02/2026, otterly.ai
  • jaeckert-odaniel.com, “Prompt search volume: Real data or all guessed?”, 16/12/2025, jaeckert-odaniel.com