Por qué dudas al mirar tu marca en la IA
Abres una herramienta de visibilidad en IA. Ves rankings, puntuaciones, gráficos limpios.
Y te entran ganas de creértelos.
Pero la semana siguiente tu marca aparece tres puestos más abajo, sin que hayas tocado nada.
¿Esa puntuación sirve para decidir, o solo decora?
Es una duda sana.
Porque en este campo conviven números que son señal y números que son ruido. Y casi nadie los separa.
Hoy lo hacemos con tres estudios independientes.
2.961 consultas: el ranking es ruido
SparkToro hizo lo que tocaba: repetir, repetir y repetir.
600 voluntarios lanzaron 2.961 consultas de recomendación de marca a tres modelos de IA distintos (estudio).
Aquí hay dos datos que conviene fijar.
- La lista idéntica de marcas se repetía en menos del 1% de los casos.
- El orden exacto coincidía solo en torno al 0,1%.
Es decir, el ranking de un día concreto es básicamente ruido.
Pero hay un segundo número que se comporta justo al revés.
La tasa de aparición —cuántas veces de N apareces— se mantenía estable. Una marca muy visible salía en el 97% de 71 consultas, y ese tipo de dato sí aguanta una comparación mensual.
Piénsalo como un dado. No puedes predecir qué saldrá en la próxima tirada, pero la frecuencia de cada cara es predecible.
Por eso, anotar que hoy estás tercero y mañana séptimo es como apuntar tiradas sueltas de un dado. No decide nada.
Los prompts estimados aún sirven para comparar
La investigación de Otterly AI añade un matiz interesante (estudio).
Comparó los prompts reales de los usuarios con los prompts estimados que generan las herramientas.
Los reales tenían 15,1 palabras de media. Los estimados, 8,8.
Los primeros son más largos, más personales y describen un problema concreto. Los segundos son cortos y suenan a catálogo.
¿Significa eso que los prompts estimados no valen para nada?
No exactamente.
Porque, pese a esa diferencia, el ranking relativo entre marcas salía “bastante parecido” en ambos casos.
Es decir, un prompt estimado no retrata la realidad exacta, pero todavía te sirve para situarte frente a tu competencia.
Como brújula aproximada, vale. Como mapa exacto, no.
El “volumen de búsqueda de prompts” engaña
Hay un tercer número que pide más cautela: el volumen de búsqueda de prompts.
Una revisión crítica de jaeckert-odaniel.com es bastante dura con él (estudio).
El problema no es la cifra en sí, sino sus cimientos.
- Los datos vienen sobre todo de Chrome en escritorio, así que se pierde buena parte del uso en móvil.
- Los paneles tienden a un perfil tecnológico, lo que rompe la representatividad de la muestra.
- Y al extrapolar desde muestras pequeñas, el error se acumula y aparece una falsa precisión.
Un número con tres decimales parece riguroso. Pero si la base está sesgada, esa precisión es decorativa.
Sirve para formular hipótesis. No para colocarlo como KPI principal de tu presupuesto.
Qué mirar primero en una herramienta de IA
Cuando abres una herramienta de visibilidad en IA, el ojo se va a los rankings y a las puntuaciones grandes.
Pero lo primero que deberías comprobar son otras dos cosas.
Una: ¿cuántas repeticiones hay detrás de ese número?
Dos: ¿cómo define exactamente la tasa de aparición?
Si eso queda en la nebulosa, da igual lo bonito que sea el panel. La decisión se vuelve frágil.
Mira si la herramienta publica su metodología, como hizo SparkToro, o si al menos parte de varias decenas de repeticiones.
Y el volumen de búsqueda de prompts, mejor déjalo como indicador de apoyo, junto a las tendencias de ranking y tus datos propios. Nunca como número estrella.
Medir la IA no es imposible. Solo hay que saber qué número es señal… y cuál solo decora.
Fuentes
- Rand Fishkin (SparkToro/Gumshoe), “NEW Research: AIs are highly inconsistent when recommending brands or products”, 2026-01-27, sparktoro.com
- Thomas Peham (Otterly AI), “Real vs Estimated Prompts: I Analyzed 100s of Real ChatGPT Queries”, 2026-02-03, otterly.ai
- jaeckert-odaniel.com, “Prompt search volume: Real data or all guessed?”, 2025-12-16, jaeckert-odaniel.com