Premessa: uno sterile esercizio di data journalism
Nell’ambito di un corso che sto frequentando ho dovuto fare un esercizio di data journalism. Avendo completa libertà per quanto riguarda l’argomento, e non avendo nessun progetto in corso che avrebbe guadagnato dall’aggiunta di dati, ho deciso di dedicarmi a una sorta di divertissement con il podcast Morning, la rassegna stampa quotidiana di Francesco Costa.
Per l’occasione sperimento anche un formato particolare di articoli, a piena grandezza (senza barra laterale). Chi legge questo articolo tramite feed RSS o email potrebbe non vedere correttamente i grafici.
I numeri di Morning
Morning è uno dei podcast riservati agli abbonati del Post ed è condotto dal vicedirettore Francesco Costa, occasionalmente sostituito dal direttore Luca Sofri. Trattandosi di una rassegna stampa, gli episodi vengono pubblicati ogni mattina dal lunedì al venerdì.
Per questa analisi quantitativa di Morning ho preso in considerazione due aspetti: la durata di ogni episodio e l’orario di pubblicazione.
I dati sulla durata dei vari episodi provengono dalla pagina del podcast sul sito del Post, mentre per l’orario di pubblicazione mi sono invece basato dall’account twitter @ilpost (basta cercare “ep. (from:ilpost)
” per isolare i tweet dei podcast) sul quale vengono automaticamente annunciati i nuovi episodi: né l’app del Post né la pagina web indicano infatti l’orario di pubblicazione, ma l’orario dei tweet corrisponde, con un ritardo di al massimo uno o due minuti, a quello riportato (per i primi cento episodi liberamente disponibili) su Apple Podcast.
Ho analizzato i primi 336 episodi del podcast, dal 17 maggio 2021 al 7 ottobre 2022.
Una rassegna di 24±3 minuti
Quanto dura Morning?
Si va dai 18 minuti del 21 maggio 2021 ai 36 minuti del 18 ottobre 2021, ma in realtà la maggior parte degli episodi non si discosta troppo dai 24 minuti, come si vede da questo grafico con la classica ”curva a campana” della distribuzione normale:
La deviazione standard – che misura la variabilità di una serie di dati, grosso modo quanto è ”schiacciata” la campana – è di poco inferiore ai tre minuti il che significa che la maggior parte delle puntate (circa l'80%) dura dai 21 ai 27 minuti.
Tuttavia la durata delle puntate non è distribuita uniformemente nel tempo. Lo si vede chiaramente se dividiamo in tre il grafico precedente, distinguendo tra Early Morning (fino al 4 novembre 2021), Mid Morning (dal 5 novembre 2021 al 13 aprile 22) e Late Morning (dopo il 14 aprile): passando da un intervallo all'altro si vede la curva spostarsi a destra (e appiattirsi)
La media passa da poco più di 23 minuti per Early Morning a quasi 26 per Late Morning, tre minuti in un anno e mezzo circa. Questa tendenza al rialzo è visibile in questo grafico:
Cosa ci aspetterà il futuro? Tra una decina d'anni arriveremo a un'ora di rassegna stampa e Morning durerà, quando Francesco Costa andrà in pensione intorno al 2050, circa un'ora e 45 minuti. Questo ipotizzando che la crescita sia lineare; se per caso fosse esponenziale – e ormai dovremmo tutti essere esperti di crescita esponenziale – per raggiungere il traguardo di un'ora di Morning basterebbero in 8 anni. Al momento della pensione di Costa avremmo quasi 13 ore di rassegna stampa e basterebbero pochi anni in più per il traguardo della rassegna stampa perpetua con episodi di 24 ore.
Prima delle 8. La metà delle volte
Quando viene pubblicato un nuovo episodio di Morning? "Prima delle 8" si legge nella presentazione ma – anche tenendo conto del ritardo di uno o due minuti dei tweet – sarebbe forte più corretto dire "intorno alle 8".
Se guardiamo la distribuzione degli orari, vediamo infatti che le 8:00 sono la mediana, ovvero quel valore che divide esattamente in due una serie (metà dei valori sono inferiori, metà superiori). Va comunque detto che sono pochi gli episodi caricati dopo le 8:05.
La deviazione standard, che come detto indica l'intervallo in cui si trovano la maggior parte dei valori, è di circa 20 minuti, ma questa variabilità la troviamo soprattutto per gli episodi pubblicati in anticipo, come si vede da questo grafico dove la classica ”curva a campana” è chiaramente asimmetrica:
Se distinguiamo nuovamente tra Early Morning, Mid Morning e Late Morning notiamo nuovamente uno spostamento in avanti della curva, per quanto meno evidente rispetto a quello visto per la durata degli episodi.
C'è una correlazione tra orario di pubblicazione e durata? La cosa avrebbe senso: più l'episodio è lungo, più tempo di vuole a registrarlo e a sistemare l'audio. E infatti confrontando la durata degli episodi con l'ora di pubblicazione si nota una (leggera) correlazione:
La durata degli episodi è uno dei fattori che influisce sull'orario di pubblicazione, ma non il principale.
Conclusioni (e possibili miglioramenti)
L'ho definito "sterile esercizio di data journalism" ma in realtà qualche informazione interessante, come gli episodi leggermente più lunghi, è venuta fuori. Ovviamente non mi riferisco alla proiezione – difficile chiamarla "previsione" – sulla durata dei futuri episodi di Morning: forse la media si alzerà ancora un po', ma dubito si arriverà a più di mezz'ora.
Non ho distinto, ma sarebbe stato utile farlo, né gli episodi registrati da Luca Sofri (che mi aspetto abbiano una durata diversa) né quelli registrati durante le trasferte negli Stati Uniti (e mi sorprenderebbe se il fuso orario non avesse influenzato l'orario di pubblicazione). Non ricordo infatti quando sono avvenute sostituzioni e trasferte e non ho voglia di riascoltare le vecchie puntate per scoprirlo; se qualcuno ha questa informazione, posso valutare di aggiornare questo articolo.Francesco Costa mi ha segnalato i periodi di “supplenza” di Luca Sofri e quelli in cui Morning è stato registrato negli Stati Uniti; non ho aggiornato le statistiche ma ho evidenziato nei grafici questi episodi particolari.