Musk rende pubblico l’algoritmo di Twitter: cerchiamo di capire come funziona

Servizio a cura di Marco Barsotti

La stampa non ne ha praticamente parlato, ma venerdì 31 marzo è stata una data storica. Grazie a Elon Musk, per la prima volta un social network ha reso pubblico il cosiddetto algoritmo (in questo caso addirittura il codice sorgente) che decide cosa vediamo nella nostra timeline.

Con questo articolo cerchiamo di farne un rapidissimo riassunto e di dare qualche consiglio a chi volesse aumentare la propria visibilità sul social usato da “everybody who is somebody“.

500 milioni di tweet/giorno

Partiamo da un fatto: ogni giorno vengono generati circa 500 milioni di Tweet: scopo dell’algoritmo decidere quali mostrare a ciascun utente. Il sistema si chiama “Home Mixer” ed è scritto in gran parte nel linguaggio Scala.

L’algoritmo di Twitter: Tre fasi e due gruppi

L’algoritmo si articola in tre fasi, parzialmente (ma non totalmente) basate sulla IA (Intelligenza Artificiale). Prende in considerazione i contenuti di due gruppi di utenti: In Network, coloro che seguiamo o ci seguono e Out of Network, coloro che non seguiamo.

Fase 1

Di nome “Candidate Sources” pende in considerazione in modo eguale (50/50) tweet effettuati da persone che seguiamo e da sconosciuti, con l’obiettivo di selezionarne 1500 (lo 0,0003% del totale).

In Network

I tweet “in network” sono selezionati in base alla probabilità di un “engagement” (una reazione, quale un like, un commento o un retweet) da parte del singolo utente.  Viene utilizzata una regressione basata sulle interazioni reciproche passate.

Out of Network

I tweet “out of network” sono selezionati in base al “social graph“, in sostanza lo stesso criterio precedente ma applicato “agli amici degli amici” (se ci permettete questa espressione vagamente sinistra).

In altre parole se io sono A, ho un amico B e non seguo C, ma B ha un alto engagement con C allora forse anch’io A posso aver interesse in quanto afferma C.

Confusi?

Confusi? Restate con noi, ancora pochi passaggi e arriviamo ai consigli per gli acquisti (anzi, per i tweet).

Fase 2

In questa fase viene generata una rappresentazione numerica degli interessi dei singoli utenti e del contenuto dei tweet. In questo modo è possibile calcolare l’affinità dei tweet disponibili con i nostri interessi in base alla distanza tra i due numeri.

Un esempio

In altre parole se una persona con cui ho interessi comuni (diciamo: Nicola Franceschini) parla di un argomento che mi interessa (diciamo: Ryuichi Sakamoto) allora il suo tweet apparirà prominente nella mia timeline.

Se invece sempre Franceschini parlasse di Laura Pausini allora il suo messaggio comparirebbe egualmente, ma molto in basso. Se invece a parlare di Laura Pausini fosse un altro membro della comunità di Talkmedia (ipotizzando che fosse attivo su Twitter) allora nulla sarebbe riportato nella timeline di chi scrive.

Altri Social

Questo esempio è rilevante in quanto è ipotizzabile (per motivi che non stiamo ad analizzare) ci siano numerose similitudini anche con l’algoritmo di Facebook e di altri social.

Parametri e Peperoni

L’ordinamento di cui sopra, detto ranking, è effettuato da una minuscola rete neuronale (dunque: da una IA) composta da 48 milioni di parametri (per fare un confronto: GPT 3.5, probabilmente utilizzato da Peperoni AI per il programma di Patrizia su radio 70-80.it) dispone di circa 170 miliardi di parametri (364500% di più!).

Infine viene applicato un filtro euristico (metodo non totalmente scientifico che utilizza senso comune e semplici regole) per filtrare ulteriormente i contenuti, evitare di vederne troppi dalle stesse persone e inserire qualche pubblicità nel mix finale.

Consigli per gli acquisti

Ed eccoci alla ricetta per un tweet di successo, ricavata da alcuni programmatori che hanno analizzato non la nostra spiegazione ma proprio il codice sorgente reso pubblico a fine marzo.

Cosa cercare (boost)

Questi i fattori che favoriscono la diffusione di un nostro contenuto:

  • Like (30x, trenta volte più’ di un tweet che ne e’ privo)
  • Retweet Count (20x per ogni retweet, a giudicare dal codice qui sopra)
  • Contenuto che include immagini o video (4x)
  • Contenuto che ha ricevuto almeno un commento (2x)

Questi invece i fattori che incidono negativamente

  • Tweet che consiste solo in una URL
  • Retweet senza commento/testo aggiunto
  • Tweet che è stato bloccato, anche solo da un utente
  • Tweet che ha causato un “unfollow”
  • Tweet che è stato segnalato come inappropriato

Conclusioni

Con l’inedita decisione di rendere pubblico l’algoritmo (peraltro non molto sofisticato) di Twitter Elon Musk ha dato a tutti la possibilità di vedere (abbastanza) chiaro in uno dei grandi misteri del nostro tempo, quello stesso che permette alla stampa di affermare – senza prove – che (ad esempio) la decisione sulla Brexit è stata “influenzata dai social network“.

Speriamo Meta e gli altri vogliano presto seguirne l’esempio.

(Marco Hugo-Barsotti per FM-World)

* Per comunicati e segnalazioni: [email protected]

Nasce partnership tra MediaDAB e 22HBG: vediamo come si inquadra in un mondo dove l’ascolto della radio in mobilità è fortemente minacciato

MediaDab e 22HBG hanno recentemente firmato una partnership con l’obiettivo di immaginare, sperimentare e portare sul mercato soluzioni rivoluzionarie nel settore dell’intrattenimento e dell’informazione in mobilità.  Proviamo con questo articolo a capire cosa riguarda e la sua importanza in un mondo dove la radio non è più al centro del car entertainment.

 Si tratta qui di innovare nell’ambito dell’intersezione tra tre tecnologie: il DAB, che ha le sue radici nel mondo broadcast; le app, che vengono invece da quello dell’online; e la vera grande rivoluzione del 2023, i Large Language Models alla base dell’Intelligenza Artificiale (IA) che abbiamo tutti recentemente scoperto grazie a ChatGPT e Peperoni AI. 

I protagonisti

Ma chi sono I protagonisti di questo accordo? Presto detto: MediaDAB è uno dei recentissimi consorzi nati per aiutare l’emittenza locale e le superstation a migrare verso il DAB, la Radio Digitale da cui per troppi erano state escluse. Non si tratta solo di radio prettamente locali: anche preminenti superstation sono attualmente veicolate multiplex di mediaDAB. 

22HBG è invece un entità più difficile da afferrare: nata da una costola di Elenos, storico produttore italiano di apparati e soluzioni dedicati al broadcast, si è evoluta su svariati assi apparentemente scorrelati (o almeno questa la prima impressione che si può avere analizzandone il sito). Si va da un giornale online che racconta in tempo reale quanto accade nel mondo broadcast, al gruppo social dedicato (parliamo di FM-world), a una soluzione completa per lo sviluppo e la fruizione dei recentissimi modelli di IA (PeperoniAI), a un aggregatore di emittenti radio e TV  decisamente unico. Senza dimenticare le soluzioni per la gestione dei contenuti dedicate ai broadcaster.

Convergenza 

Il filo conduttore però esiste è quello della convergenza di media e contenuti resa possibile dalla digitalizzazione e dagli standard aperti.  Come ben sanno le redazioni dei quotidiani che ormai da tempo lavorano su piattaforme tecnologiche uniche in grado di erogare e adattare i contenuti su web, blog, podcast, canali tv interattivi, HBBTV. E carta stampata. 

E qui ci ricongiungiamo col senso dell’accordo con cui abbiamo aperto.  

 

Come chiarisce questo semplice grafico…Ok, forse meglio prenderla da un angolo più user-oriented. 

Dashboard

Partiamo dai meravigliosi cruscotti delle autovetture di ultima generazione: lo spazio dedicato all’ intrattenimento è diventato come sappiamo terreno strategico di lotta tra i grandi gruppi editoriali nazionali oltre che tra questi e le piattaforme globali. 

 La cosiddetta Uberizzazione, che nel settore dei media è anche detta Netflixizzazione è dietro l’angolo anche per il comparto radiofonico, rimasto finora un caso unico dove il perdurare dell’analogico (FM e AM) ha permesso di godere delle rendite di posizioni anche oltre i tempi supplementari 

Purtroppo, Il bel segnale pulito emesso dagli storici trasmettitori dei principali network non potrà continuare ad apportare vantaggi che per pochi anni, non fosse altro che per questioni di consumi energetici. 

Uno vale uno

 Ma nel DAB e nell’online uno vale uno e il logo che fa bella mostra di sé sullo sfavillante cruscotto non rappresenta certo elemento di differenziazione. 

Da qui la necessità di fidelizzare tramite nuovi tipi di interazione quelli resi possibili da soluzioni custom basate sulla sinergia tra DAB e IP. E non parliamo solo del “Dab over IP” di cui si discute dal 2019, quella tecnologia che prevede in sostanza di incapsulare in pacchetti IP i dataframe DAB senza perderne i metadati. 

Pensiamo piuttosto ad applicazioni più vicine all’utente: proviamo a fare due esempi per chiarire. È evidente a tutti che uno dei vantaggi competitivi di Google e Facebook rispetto alla classica emittenza broadcast sta nella granularizzazione (e anche nella “targettizzazione” di cui discutono tutti. Ma a noi preme parlare della prima). In altre parole, anche una piccola attività economica, quale un negozio di quartiere, può grazie ai colossi del web attivare campagne a costi accettabili (parliamo di poche decine di euro a settimana) 

Basta limitare l’erogazione a una singola città, o perfino a una zona: cose ovviamente precluse non solo all’FM ma anche al DAB, che di fatto utilizza in Italia le stesse topologie basate su trasmettitori di grande potenza che coprono vaste aree. 

DAB e aggregatori

Immaginiamo ora una stretta integrazione tra un flusso DAB e un aggregatore di grande popolarità quale FM-world: nulla vieta di realizzare la medesima granularizzazione, erogando flussi IP contenenti spot differenziati per area geografica, attivabili eventualmente solo quando richiesto. Con i costi relativi. 

Un secondo esempio potrebbe riguardare l’interazione con gli ascoltatori: siamo abituati a emittenti che ci chiedono di rispondere sul tema del giorno (“diteci cosa pensate di…”), ma poi quello che accade è che in onda vengono letti solo pochi messaggi scelti dai conduttori. Nessuna valenza scientifica o di sondaggio in tutto questo 

Ma la radio, con la sua diffusione orizzontale e il suo vasto pubblico permette di realizzare opinion polls significativi con risultati in tempo reale (visto che a rispondere sono spesso ben più di 1000 ascoltatori). 

La raccolta e l’analisi delle risposte e’ tecnicamente realizzabile come sviluppo verticale sulla base dell’esistente funzionalità “Interactive MUX” offerta da 22HBG. 

Big Data

L’integrazione di cui parliamo porta poi un enorme vantaggio, che sarà in prospettiva sempre più strategico. Si chiama big data, la grande quantità di informazioni relative ai singoli utenti che già oggi possiamo collezionare da chi ascolta via app. Sono darti grezzi, che necessitano di strumenti di analisi e sintesi potenti: e qui il ruolo dei sistemi basati sulla AI, in grado di analizzare e sintetizzare autonomamente enormi quantità di dati diventerà con il tempo indispensabile

Chi possiede i dati?

Ma chi possiede i dati? Questo è un punto strategico cui conviene prestare la massima attenzione. Se non si presidia il dashboard, proprio con sistemi quali quelli di FM-world o anche al limite app proprietarie, il rischio è che queste informazioni vengano regalate tutte alle case automobilistiche. Ma se in qualche modo è lecito che queste ultime collezionino informazioni su stile di guida dei clienti e performance dei veicoli, molto più difficile appare accettare che conoscano anche i nostri gusti in termini di intrattenimento. Soprattutto quando questi impattano il core business delle radio.

Differenziazione 

Abbiamo voluto citare due esempi che richiedono sviluppi custom e non funzionalità pronte da erogare. 

Ma il punto è proprio questo. In un mondo dove non è più la potenza del segnale a fare la differenza non può essere che lo sviluppo di soluzioni verticali, sulla base dei solidi protocolli standard di DAB e IP, a differenziare le singole emittenti. E non abbiamo parlato dell’ulteriore integrazione con i vari LLM (large language models, ChatGPT e concorrenti) qualcosa su cui ci riserviamo di ritornare a breve.  

Per ora invitiamo tutti i lettori a lavorare di fantasia e creatività: anche le idee più ardite sono probabilmente realizzabili ormai in tempi molto rapidi. (M.H.B.)