Caso Studio
Sanremo 2026: l'AI legge il megathread di r/italy
così non devi farlo tu.
Ogni sera del Festival di Sanremo 2026, migliaia di italiani si radunano sul megathread di r/italy per commentare in tempo reale — nel bene, nel male e nel "ma chi gliel'ha fatto fare". Chi viene più citato? Chi fa incazzare di più? Chi raccoglie il sentiment più positivo (o chi è il più cringe)? Questi segnali sono pubblici e accessibili, ma qualcuno doveva pur raccoglierli.
Il problema è che il megathread è migliaia di commenti di testo informale: slang, soprannomi, ironia a raffica, offese creative. Estrarne chi sta vincendo il festival secondo la voce del popolo di internet richiede raccolta automatica, paginazione e analisi del sentiment in italiano colloquiale.
Southwind AI ha costruito una pipeline che ogni giorno dopo una serata scarica l'intero megathread, lo analizza commento per commento e genera automaticamente un report con previsioni, sentiment e insight — perché capire chi sta dominando Sanremo secondo Reddit è molto più divertente che aspettare la giuria.
Prima e dopo (con dati esempio)
Da 4.000 commenti caotici a previsioni leggibili
| artista | brano | reddit_mentions | reddit_score | reddit_total_comments | sentiment_score | sentiment_label |
|---|---|---|---|---|---|---|
| Arisa | Magica favola | 312 | 4841 | 4203 | 0.44 | positivo |
| Bambole di pezza | Resta con me | 247 | 3910 | 4203 | 0.38 | positivo |
| Chiello | Ti penso sempre | 183 | 2774 | 4203 | 0.22 | positivo |
| Dargen D'Amico | Ai Ai | 121 | 1902 | 4203 | 0.09 | neutro |
| Ditonellapiaga | Che fastidio! | 98 | 1044 | 4203 | -0.14 | negativo |
| Eddie Brock | Avvoltoi | 74 | 891 | 4203 | 0.17 | positivo |
| Elettra Lamborghini | Voilà | 53 | 712 | 4203 | 0.05 | neutro |
Dati grezzi: migliaia di commenti da classificare artista per artista, con tutto lo slang, l'ironia e gli insulti creativi tipici di Reddit.
Serata 1 — Festival di Sanremo 2026
La voce del megathread: chi ha vinto la serata
Artisti analizzati
30
Commenti letti
4.203
Favorita Reddit
Arisa
Top 4 per menzioni nel megathread
💬 Insight chiave
Arisa domina il megathread con 312 menzioni e sentiment +0.44. Reddit ha già deciso: è lei la favorita, la giuria dovrà solo adeguarsi.
Report leggibile, con previsioni e sentiment analysis. Generato automaticamente ogni giorno dopo la serata in pochi minuti — senza leggere 4.000 commenti a mano.
Perché nessuno lo faceva
Il megathread c'è. Leggerlo tutto è un altro discorso.
Il megathread serale di r/italy è una miniera d'oro: migliaia di italiani che commentano in tempo reale, senza filtri e con un'opinione su tutto. Trasformarlo in previsioni richiede però di superare ostacoli che rendono l'analisi manuale praticamente impossibile (e molto poco salutare):
- Migliaia di commenti nascosti: Reddit non ti mostra tutti i commenti insieme — li carica a blocchi, uno dopo l'altro. Per leggere un megathread completo bisogna continuare a chiedere "dammi altri commenti" decine di volte di fila. Non basta aprire il link e scorrere giù.
- Slang, ironia e insulti creativi: "Bravo" su Reddit può essere un complimento sincero o puro sarcasmo — dipende dal contesto. L'italiano colloquiale del megathread non lo capisce nessun dizionario: serve qualcosa in grado di cogliere il tono, non solo le parole.
- Reddit si stanca in fretta: Se fai troppe richieste di fila, Reddit smette di risponderti — come un cameriere che dopo il decimo tavolo ti ignora. Bisogna sapere quando rallentare e riprovare senza perdere il filo.
- Gli artisti hanno mille nomi: "Madame", "la Madame", "quella con i capelli" — le stesse persone vengono chiamate in modi diversi da commento a commento. Trovare tutte le menzioni senza confondere Ultimo con "l'ultimo che ha cantato" richiede una logica su misura.
Come funziona
Tre passi. Zero commenti da leggere.
-
01
Scaricamento del megathread
Ogni sera il sistema apre il megathread di r/italy e legge tutti i commenti — fino all'ultimo "ma davvero han fatto passare quello?". Non si ferma ai primi che compaiono: li recupera tutti, uno dopo l'altro, con calma. Per ogni artista in gara conta quante volte viene nominato, quanto piace (o non piace) a chi scrive, e con che tono.
-
02
Analisi AI
Southwind AI analizza il dataset, incrocia volume di discussione e sentiment, identifica chi polarizza di più, chi ha il pubblico più entusiasta e chi invece sta collezionando meme imbarazzanti. Ogni report è unico e personalizzato per la serata — niente copia-incolla dal giorno prima.
-
03
Report pubblicato
Southwind AI genera un report leggibile, con previsioni, trend e insight, e lo pubblica automaticamente — così il giorno dopo puoi condividerlo al posto di mandare screenshot casuali del megathread ai tuoi amici.
Archivio
Report per serata
Un report per ogni serata, generato automaticamente dopo che Reddit ha finito di litigare. Nessun giornalista è stato consultato nel processo.
- Serata 1 Leggi il report →
Southwind AI
Siamo tre ingegneri informatici del Politecnico di Milano che aiutano le aziende a trasformare i dati in insight.
Hai dati da analizzare? Noi li leggiamo al posto tuo.
Southwind AI trasforma qualsiasi dataset in report automatici, ricchi di insight e previsioni — non solo megathread di Reddit. Raccontaci il tuo caso, ti risponderemo entro 24 ore (senza usare l'ironia).