Reddit è diventata la principale fonte per i LLM – Lo studio di Minddex su 9.286 citazioni

Questo studio condotto da Minddex, che include 9.286 citazioni da Reddit, ci aiuta a comprendere come i LLM utilizzino Reddit come fonte. I risultati mettono in discussione molte opinioni consolidate sulla strategia GEO e sui contenuti.

Punti Chiave:

Partecipazione invece di creazione di contenuti: il 78% delle citazioni di Reddit nelle risposte degli LLM proviene da discussioni organiche di terze parti, non da contenuti pubblicati dai marchi stessi.
I commenti sono più preziosi dei post: il 62% delle citazioni è generalmente costituito da commenti brevi (150-400 caratteri), non dal testo del post originale.
Gli upvote non sono filtri: l'82% dei commenti citati ha tra 1 e 5 upvote. Gli LLM leggono non solo i contenuti con il punteggio più alto, ma l'intero titolo.
Contenuti rilevanti per 6-24 mesi: l'età mediana dei contenuti citati di Reddit è di 280 giorni. I contenuti nuovi non ottengono alcun privilegio.

Pone le Domande Giuste

Poiché i motori di ricerca generativi (Google AI Overviews, ChatGPT Search, Perplexity, ecc.) hanno cambiato il nostro modo di trovare informazioni su Internet, la visibilità dei marchi in queste risposte è diventata strategica.

In questo contesto, Reddit occupa una posizione speciale. La piattaforma è ampiamente indicizzata, le discussioni sono percepite come una voce autentica dagli LLM e il contenuto copre migliaia di nicchie tematiche.

Quindi, come utilizzano i modelli di intelligenza artificiale Reddit? Quali discussioni citano? Quali tipi di contenuti preferiscono? E cosa significa questo per la visibilità di un marchio nelle risposte dell'intelligenza artificiale?

Minddex ha cercato di misurare queste domande in uno studio pubblicato ad aprile 2026. Il team ha analizzato 9.286 citazioni da Reddit provenienti da 291 settori diversi. Il periodo di tempo copre dal 4 al 20 aprile 2026 e include 1.854 subreddit unici e 2.066 titoli diversi.

Lo studio si articola attorno a quindici domande operative sotto quattro temi: strategia di presenza, segnali di interazione, struttura dei contenuti e meccaniche degli LLM.

Strategia di Partecipazione Più che di Pubblicazione

La prima contraddizione con le intuizioni comuni è la strategia fondamentale. Molti marchi spendono tempo e risorse per creare titoli Reddit specifici per il proprio nome: AMA organizzati (Ask Me Anything), post pubblicati sotto i propri account o titoli di discussione progettati per mettere in risalto i loro prodotti o servizi.

I dati dello studio mostrano che questo approccio è tre volte meno efficace rispetto all'alternativa -> partecipare a discussioni già esistenti.

Partecipare a un titolo esistente è migliore - Fonte: Minddex

Dei 6.248 citati, 4.874 si riferiscono a titoli organici (discussioni nate senza l'intervento del marchio), mentre solo 1.374 si riferiscono a titoli specifici. In altre parole, il 78% delle citazioni proviene da titoli esistenti con la partecipazione del marchio, non da iniziative.

In sintesi, è necessario identificare le discussioni rilevanti che avvengono all'esterno e fornire un contributo significativo a queste discussioni, piuttosto che creare contenuti. Questo cambiamento di paradigma è riassunto nello studio con l'espressione "iniziare discussioni" invece di "creare contenuti".

Commenti: Dove Viene Determinato il Vero Valore

La seconda lezione importante: il contenuto citato dagli LLM è spesso frainteso. L'attenzione dei marchi è generalmente focalizzata sul post principale di un titolo, sul titolo stesso e sul testo. Tuttavia, lo studio rivela che il 62% delle citazioni proviene dai commenti, mentre solo il 38% proviene dal testo del post originale.

Questa cifra ha una conseguenza pratica: il primo commento ben scritto di un titolo è generalmente più prezioso in termini di visibilità per l'intelligenza artificiale rispetto al post. Perché, anche se tecnicamente non si distingue, gli LLM prendono in considerazione l'intera discussione e un commento chiaro, conciso e direttamente correlato alla domanda posta nel titolo è esattamente il tipo di contenuto da riutilizzare.

La lunghezza ottimale dei commenti citati è compresa tra 150 e 400 caratteri, ovvero circa due o tre frasi. La mediana dei post citati è di 522 caratteri, quindi è lunga circa un paragrafo. Al contrario, solo il 0,6% proviene da commenti che superano i 1.000 caratteri. Pertanto, la densità è più importante della portata.

I Formati Preferiti dagli LLM

Lo studio ha analizzato anche il formato dei post da cui sono stati estratti i commenti. Il risultato è chiaro: il formato Domanda-Risposta (post in cui il titolo è una domanda) rappresenta il 44,2% dei commenti citati, mentre i post di discussione sono il 35,8%, le proposte il 9,3%, le liste il 5,7%, i confronti il 3,1% e le recensioni il 2%.

Gli LLM preferiscono il formato domanda-risposta - Fonte: Minddex

Il formato domanda-risposta genera quasi tanto quanto la somma di tutte le altre categorie di commenti. Non è una coincidenza: gli LLM sono sistemi che rispondono a domande. Quando un utente pone una domanda a un LLM, naturalmente si rivolgono a fonti che rispondono a domande simili.

Il risultato strategico è chiaro: è necessario mirare principalmente ai titoli che sono domande e strutturare i propri contributi come risposte dirette alla domanda posta, anche nei titoli di discussione aperta. Scrivere "La migliore opzione per X è Y perché..." è sempre più prezioso in termini di visibilità dell'intelligenza artificiale rispetto a un contributo non strutturato.

Gli Upvote Non Sono un Filtro di Karma

Questo è forse il risultato meno intuitivo dello studio. Nella logica classica di Reddit, la visibilità di un commento dipende in gran parte dagli upvote: i commenti con più upvote vengono messi in evidenza nel titolo e quindi letti principalmente dagli utenti.

Tuttavia, gli LLM non funzionano in questo modo. Prendono l'intero titolo, non solo i commenti con più voti. E i dati lo dimostrano: l'82% dei commenti citati nello studio ha tra 1 e 5 upvote. I contenuti virali o con molti upvote non costituiscono la maggioranza dei commenti citati dai modelli.

Allo stesso modo, lo studio non trova alcun privilegio per il punteggio karma dell'autore. Essere un utente riconosciuto su Reddit e avere un forte background di contributi apprezzati dalla comunità non garantisce una maggiore citazione statistica da parte di un LLM. Ciò che conta è la qualità e la pertinenza del contenuto al momento in cui il modello prende il titolo, non il profilo dell'autore.

Questa scoperta mette in discussione due strategie frequentemente menzionate nei dibattiti su GEO: inseguire gli upvote e reclutare contributori efficaci su Reddit. Entrambe non sono in linea con il modo in cui gli LLM operano sulla piattaforma.

L'Età del Contenuto: Il Contenuto Evergreen Predomina

Un terzo punto di rottura riguarda le abitudini di marketing digitale: la freschezza del contenuto non è un vantaggio su Reddit nel contesto delle risposte degli LLM.

La mediana dell'età dei contenuti di Reddit citati nello studio è di 280 giorni, ovvero circa nove mesi. I contenuti di età compresa tra 1 e 3 anni costituiscono da soli il 31,8% delle citazioni. Al contrario, i contenuti pubblicati nelle dieci settimane successive hanno solo un tasso di citazione del 11,6%.

Gli LLM preferiscono contenuti più vecchi - Fonte: Minddex

Questa distribuzione ha un impatto diretto sul modo in cui viene valutata la strategia di Reddit dal punto di vista di GEO: gli KPI trimestrali non sono ben allineati. Un commento condiviso oggi in un titolo richiederà alcuni mesi prima di iniziare a essere efficace nelle risposte degli LLM. L'intervallo di tempo rilevante per una strategia Reddit focalizzata sull'intelligenza artificiale è tra 6 e 24 mesi.

Questo punto è strutturalmente importante per i team SEO e i manager di marketing: il lavoro fondamentale svolto oggi su Reddit non sarà visibile nei rapporti del trimestre successivo, ma apparirà nei rapporti dell'anno successivo.

Come Usano Reddit gli LLM: Citazione Non, Parafrasi

Lo studio ha esaminato anche il meccanismo di riutilizzo dei contenuti di Reddit da parte dei LLM, misurando la similarità coseno tra le risposte dei modelli e le citazioni di Reddit definite.

Il risultato è chiaro: l'80% delle citazioni ottenute sono parafrasi, non citazioni dirette. La similarità mediana è 0.62, che equivale a una riformulazione morbida. Solo lo 0.2% è stato riprodotto quasi come testo.

Il significato di ciò per la strategia di contenuto: scrivere per essere parafrasati, non per essere citati. Un testo progettato per il testo completo, con espressioni elaborate e trasformazioni di marca, si allontana completamente dal vero meccanismo dei LLM. Ciò che funziona è un contenuto strutturato per rispondere chiaramente a una domanda reale; questo è un linguaggio naturale di comunità che un utente medio di Reddit userebbe per spiegare qualcosa a un amico.

Frasi di marketing, superlativi di marca, argomenti di vendita: tutto questo si perde nella parafrasi. Ciò che rimane è la struttura della risposta e le informazioni in essa contenute.

Subreddit che Aumentano la Visibilità

Per il mercato francofono, lo studio identifica un subreddit dominante: r/AskFrance. 669 citazioni e 51 progetti hanno beneficiato di questa piattaforma (su 291 analizzati), costituendo la principale fonte di visibilità per i marchi che si rivolgono a un pubblico francofono.

I subreddit successivi sono:

r/brico (555 citazioni),
r/france (345),
r/voiture (277),
r/treadmills (166),
r/runningfr (158),
r/Livres (146),
r/AchatPourLaVie (143),
r/PME_FR (141).

Questa classifica riflette una verità espressa nello studio: ogni settore ha il proprio centro. Fai da te in r/brico, automotive in r/voiture, corsa in r/runningfr, fitness indoor in r/treadmills. La mappa completa creata da Minddex include 944 settori in intersezione con 1.007 subreddit.

Per un marchio, è necessario identificare 3-5 subreddit appropriati per il proprio settore prima di definire la strategia di contenuto. La visibilità si costruisce qui, non altrove.

Citazioni Tracciabili: Un KPI Misurabile

Un'ultima nota che deve essere evidenziata, soprattutto per i team di analisi. Lo studio indica che il 65% delle citazioni di Reddit nelle risposte LLM contiene l'URL del titolo citato direttamente. Solo il 35% viene menzionato come testo senza link.

Questo dimostra che il traffico di ritorno indirizzato dalle risposte dell'intelligenza artificiale a Reddit è misurabile. Non è un'ipotesi: è un flusso tracciabile e può essere integrato nei cruscotti delle prestazioni come il traffico organico tradizionale.

Per i marchi che sviluppano una presenza su Reddit, questo apre la possibilità di misurare concretamente l'impatto delle strategie GEO e non si limita a fare previsioni qualitative.

Scopri su Minddex: Lo studio di Reddit nelle risposte LLM.

Commenti

(7 Commenti)

EY

Ekin Yıldırım

Questo studio è davvero interessante. Il fatto che Reddit sia diventato una risorsa così importante per i LLM sembra che cambierà anche le strategie di contenuto.
ZG

Zeynep Gökçe

Essere sorpreso di sentire che i commenti sono più preziosi è stata una sorpresa. Quindi i marchi dovrebbero concentrarsi di più sui commenti?
MK

Mavi Kelebek

La preferenza per il formato domanda-risposta mi ha aiutato a comprendere meglio il funzionamento degli LLM. Un'analisi fantastica!
KA

Kerem Aksu

L'efficacia delle discussioni organiche su Reddit dimostra che i marchi devono rivedere le loro strategie.
BD

Berkay Deniz

Alla luce di questi dati, è necessario riflettere di più su come i marchi dovrebbero essere presenti su Reddit.
SY

Seda Yalçın

Partecipare a discussioni invece di creare contenuti sembra essere più efficace. Dobbiamo fare un piano per mettere in pratica questo!
KŞ

Kırmızı Şemsiye

Il fatto che la maggior parte delle citazioni provenga dai commenti potrebbe cambiare radicalmente la nostra comprensione della creazione di contenuti.