Reddit se ha convertido en la principal fuente de LLM: el estudio de Minddex sobre 9,286 citas

Este estudio realizado por Minddex, que incluye 9,286 citas de Reddit, nos ayuda a entender cómo los LLM utilizan Reddit como fuente. Los resultados cuestionan muchas opiniones establecidas sobre GEO y estrategia de contenido.

Puntos Clave:

Participación en lugar de creación de contenido: El 78% de las citas de Reddit en las respuestas de los LLM provienen de discusiones orgánicas de terceros, no de contenido publicado por las propias marcas.
Comentarios más valiosos que publicaciones: El 62% de las citas son generalmente comentarios cortos (150-400 caracteres), no del texto de la publicación original.
Los upvotes no son un filtro: El 82% de los comentarios citados tienen entre 1 y 5 upvotes. Los LLM no solo leen el contenido más votado, sino que leen toda la discusión.
Contenido relevante de 6 a 24 meses: La edad media del contenido de Reddit citado es de 280 días. Los nuevos contenidos no obtienen ninguna ventaja.

Haciendo las Preguntas Correctas

Dado que los motores de búsqueda generativos (Google AI Overviews, ChatGPT Search, Perplexity, etc.) han cambiado nuestra forma de encontrar información en internet, la visibilidad de las marcas en estas respuestas se ha vuelto estratégica.

En este contexto, Reddit ocupa una posición especial. La plataforma está ampliamente indexada, y las discusiones son percibidas por los LLM como una voz auténtica, abarcando miles de nichos temáticos.

Entonces, ¿cómo utilizan los modelos de inteligencia artificial Reddit? ¿Qué discusiones citan? ¿Qué tipo de contenido prefieren? ¿Y qué significa esto para la visibilidad de una marca en las respuestas de inteligencia artificial?

Minddex intentó medir estas preguntas en un estudio publicado en abril de 2026. El equipo analizó 9,286 citas de Reddit de 291 sectores diferentes. El período de tiempo abarca del 4 al 20 de abril de 2026 e incluye 1,854 subreddits únicos y 2,066 títulos diferentes.

El estudio se centra en 15 preguntas operativas bajo cuatro temas: estrategia de activos, señales de interacción, estructura de contenido y mecánicas de LLM.

Estrategia de Participación Más que Publicación

La primera contradicción con las intuiciones habituales es la estrategia fundamental. Muchas marcas gastan tiempo y recursos creando títulos de Reddit específicos en su nombre: AMA organizados (Ask Me Anything), publicaciones bajo sus propias cuentas o títulos de discusión diseñados para destacar sus productos o servicios.

Los datos del estudio muestran que este enfoque es tres veces menos efectivo en comparación con la alternativa -> participar en discusiones ya existentes.

Participar en un título existente es mejor - Fuente: Minddex

De las 6,248 citas, 4,874 apuntan a títulos orgánicos (discusiones que surgen sin intervención de la marca), mientras que solo 1,374 apuntan a títulos específicos. En otras palabras, el 78% de las citas provienen de títulos existentes con la participación de la marca, no de su inicio.

En resumen, en lugar de crear contenido, es necesario identificar discusiones relevantes que ocurren afuera y contribuir de manera significativa a esas discusiones. Este cambio de paradigma se resume en el estudio con la expresión "iniciar discusiones" en lugar de "crear contenido".

Comentarios: Donde se Define el Verdadero Valor

La segunda lección importante: el contenido citado por los LLM a menudo se malinterpreta. La atención de las marcas generalmente se centra en la publicación principal de un título, su encabezado y su texto. Sin embargo, el estudio revela que el 62% de las citas provienen de comentarios, y solo el 38% proviene del texto de la publicación original.

Este número tiene una consecuencia práctica: el primer comentario bien escrito de un título es generalmente más valioso en términos de visibilidad de inteligencia artificial que la publicación. Porque, aunque no se destaque técnicamente, los LLM toman toda la discusión y un comentario claro, conciso y directamente relacionado con la pregunta planteada en el título es el tipo de contenido que se reutilizará exactamente.

La longitud óptima de los comentarios citados está entre 150 y 400 caracteres, es decir, aproximadamente dos o tres oraciones. La mediana de los envíos citados es de 522 caracteres, que equivale a la longitud de un párrafo. Y, por el contrario, solo el %0.6 proviene de comentarios que superan los 1,000 caracteres. Por lo tanto, la densidad es más importante que la amplitud.

Formatos Preferidos por los LLM

El estudio también analizó el formato de los envíos de los cuales se tomaron las citas. El resultado es claro: el formato de Pregunta-Respuesta (envíos cuyo título es una pregunta) representa el %44.2 de las citas, mientras que los envíos de discusión son el %35.8, las recomendaciones el %9.3, las listas el %5.7, las comparaciones el %3.1 y las reseñas el %2.

Los LLM prefieren el formato de pregunta-respuesta - Fuente: Minddex

El formato de pregunta-respuesta genera casi tanto como la suma de todas las demás categorías. No es una coincidencia: los LLM son sistemas que también responden a preguntas. Cuando un usuario hace una pregunta a un LLM, naturalmente se dirigen a fuentes que responden preguntas de tipo similar.

La conclusión estratégica es clara: es necesario dirigirse principalmente a los títulos que son preguntas y estructurar sus contribuciones como respuestas directas a la pregunta planteada, incluso en títulos de discusión abierta. Escribir "La mejor opción para X es Y porque..." es siempre más valioso en términos de visibilidad de inteligencia artificial que una participación no estructurada.

Los Upvotes No Son un Filtro de Karma

Este es quizás el resultado menos intuitivo del estudio. En la lógica clásica de Reddit, la visibilidad de un comentario depende en gran medida de los upvotes: los comentarios con más upvotes se destacan en el título y, por lo tanto, son leídos principalmente por los usuarios.

Sin embargo, los LLM no funcionan de esta manera. Ellos toman todo el título, no solo los comentarios con más votos. Y los datos lo demuestran: el %82 de los comentarios citados en el estudio tienen entre 1 y 5 upvotes. Los contenidos virales o con muchos upvotes no constituyen la mayoría de las citas que mantienen los modelos.

De igual manera, el estudio no encuentra ninguna preferencia por el puntaje de karma del autor. Ser un usuario reconocido en Reddit, con un historial sólido de contribuciones apreciadas por la comunidad, no garantiza una mayor citación estadística por parte de un LLM. Lo importante es la calidad y relevancia del contenido al momento de que el modelo toma el título, no el perfil del autor.

Este hallazgo cuestiona dos estrategias que se mencionan frecuentemente en discusiones sobre GEO: la búsqueda de upvotes y la contratación de contribuyentes efectivos en Reddit. Ambas no son compatibles con la forma en que los LLM operan en la plataforma.

La Edad del Contenido: El Contenido Evergreen Domina

Un tercer punto de inflexión está relacionado con los hábitos de marketing digital: la frescura del contenido no es una ventaja en el contexto de las respuestas de LLM en Reddit.

La edad media del contenido de Reddit citado en el estudio es de 280 días, es decir, aproximadamente nueve meses. Los contenidos de entre 1 y 3 años constituyen por sí solos el %31.8 de las citas. En contraste, los envíos publicados en las diez semanas anteriores solo tienen un %11.6 de tasa de citación.

Los LLM prefieren contenido más antiguo - Fuente: Minddex

Esta distribución tiene un impacto directo en la forma en que se evalúa la estrategia de Reddit desde la perspectiva de GEO: los KPI trimestrales están mal alineados. Un comentario compartido hoy en un título tardará unos meses en empezar a ser efectivo en las respuestas de LLM. El periodo de tiempo relevante para una estrategia de Reddit centrada en inteligencia artificial es de 6 a 24 meses.

Este punto es estructuralmente importante para los equipos de SEO y los gerentes de marketing: el trabajo fundamental realizado hoy en Reddit no será visible en los informes del próximo trimestre, pero aparecerá en los informes del año siguiente.

Cómo Usan los LLM Reddit: Cita No, Parafraseo

El estudio también examinó el mecanismo de reutilización de contenido de Reddit por parte de los LLM y midió la similitud coseno entre las respuestas de los modelos y las citas de Reddit definidas.

El resultado es claro: el 80% de las citas obtenidas son paráfrasis, no citas directas. La similitud mediana es de 0.62, lo que equivale a una reformulación suave. Solo el 0.2% ha sido reproducido casi textualmente.

La implicación para la estrategia de contenido es: escribir para ser parafraseado, no para ser citado. Un texto diseñado para el texto completo, con expresiones procesadas y transformaciones de marca, se aleja completamente del verdadero mecanismo de los LLM. Lo que funciona es un contenido estructurado para responder claramente a una pregunta real; este es un lenguaje comunitario natural que un usuario común de Reddit usaría para explicar algo a un amigo.

Frases de marketing, superlativos de marca, argumentos de venta: todo esto se pierde en la paráfrasis. Lo que queda es la estructura de la respuesta y la información que contiene.

Subreddits que Aumentan la Visibilidad

El estudio para el mercado francófono identifica un subreddit dominante: r/AskFrance. Con 669 citas y 51 proyectos que se beneficiaron de esta plataforma (de 291 analizados), representa la mayor fuente de visibilidad para marcas que apelan a un público francófono.

Los subreddits que le siguen son:

r/brico (555 citas),
r/france (345),
r/voiture (277),
r/treadmills (166),
r/runningfr (158),
r/Livres (146),
r/AchatPourLaVie (143),
r/PME_FR (141).

Este ranking refleja una realidad expresada por el estudio: cada sector tiene su propio centro. Bricolaje en r/brico, automoción en r/voiture, carrera en r/runningfr, fitness en interiores en r/treadmills. El mapa exhaustivo creado por Minddex incluye 944 industrias intersecadas con 1,007 subreddits.

Para una marca, antes de definir su estrategia de contenido, es necesario identificar de 3 a 5 subreddits relevantes para su sector. La visibilidad se construye aquí, no en otro lugar.

Citas Rastreables: Un KPI Medible

Un último punto que debe destacarse, especialmente para los equipos de análisis. El estudio señala que el 65% de las citas de Reddit en las respuestas de LLM contienen la URL del título citado directamente. Solo el 35% se presenta como texto sin enlace.

Esto demuestra que el tráfico de retorno que las respuestas de inteligencia artificial dirigen a Reddit es medible. No es una suposición: es un flujo rastreable e integrable en paneles de rendimiento como el tráfico orgánico tradicional.

Para las marcas que desarrollan una presencia en Reddit, esto abre la posibilidad de medir de manera concreta el impacto de sus estrategias GEO y no solo predecir cualitativamente.

Descubre en Minddex: El estudio de Reddit en las respuestas de LLM.

Comentarios

(7 Comentarios)

EY

Ekin Yıldırım

Este trabajo es realmente interesante. Parece que Reddit se está convirtiendo en una fuente tan importante para los LLM, lo que también cambiará sus estrategias de contenido.
ZG

Zeynep Gökçe

Me sorprendió escuchar que los comentarios son más valiosos. ¿Significa eso que las marcas deberían centrarse más en los comentarios?
MK

Mavi Kelebek

La preferencia por el formato de preguntas y respuestas me ha ayudado a entender mejor el funcionamiento de los LLM. ¡Un gran análisis!
KA

Kerem Aksu

La efectividad de las discusiones orgánicas en Reddit muestra que las marcas deben reevaluar sus estrategias.
BD

Berkay Deniz

A la luz de estos datos, es necesario pensar más sobre cómo las marcas deberían estar presentes en Reddit.
SY

Seda Yalçın

Participar en discusiones en lugar de crear contenido parece ser más efectivo. ¡Debemos hacer un plan para implementar esto!
KŞ

Kırmızı Şemsiye

El hecho de que la mayoría de las citas provengan de comentarios podría cambiar radicalmente nuestra comprensión de la creación de contenido.