Il professore ha pensato a tutto. Ma c’era un dettaglio che non aveva previsto: quando la banda è entrata nella banca… il caveau era vuoto

22 Jun 2026
Il professore ha pensato a tutto. Ma c’era un dettaglio che non aveva previsto: quando la banda è entrata nella banca… il caveau era vuoto

a cura di Rosie Audino, esperta in filosofia e comunicazione della scienza e della salute

I tuoi like alimentano un mercato da Miliardi di euro

Ogni giorno lasciamo tracce digitali ovunque: un like su Instagram, una ricerca su Google, un acquisto online, una prenotazione medica. Presi singolarmente sembrano dettagli insignificanti, ma insieme raccontano con grande precisione chi siamo. È proprio da queste informazioni che si nutre l’intelligenza artificiale, addestrata su enormi quantità di dati provenienti da siti web, social network e archivi digitali.

In questo contesto, i dati sono diventati una delle risorse più preziose dell’economia contemporanea. Più informazioni vengono elaborate, più i sistemi riescono a riconoscere schemi, fare previsioni e migliorare le proprie prestazioni. Ogni interazione contribuisce così a un mercato da miliardi di euro, in cui vengono estratte correlazioni, statistiche e modelli di comportamento.

Quando l’intelligenza artificiale deduce informazioni che non le abbiamo fornito

Fin qui potrebbe sembrare il prezzo inevitabile del progresso tecnologico, ma i rischi sono troppo rilevanti per essere sottovalutati. Lo sapevi che uno studio del MIT ha mostrato che i modelli di AI possono risalire a dati personali, come numeri di telefono, incrociando informazioni apparentemente innocue senza che siano mai stati forniti esplicitamente? E se questo può sembrare accettabile nel caso di cronologia di navigazione o preferenze di acquisto, la questione diventa molto più seria quando entrano in gioco diagnosi, referti e informazioni che appartengono alla sfera più intima delle persone.

E, in effetti, in Italia meno della metà dei cittadini, circa il 44%, ha autorizzato la consultazione del proprio Fascicolo Sanitario Elettronico da parte dei professionisti sanitari. I vantaggi della condivisione dei dati clinici sono evidenti: maggiore continuità delle cure, meno inefficienze e un supporto più efficace al lavoro dei medici. Eppure, per molte persone questi benefici non bastano a superare una delle preoccupazioni alla base di questa scelta: la fiducia.

Privacy vs innovazione: e se non servisse scegliere?

Per addestrare modelli sempre più efficaci servono dati, tanti dati. Ma le persone sono disposte a condividerli soltanto se percepiscono che verranno trattati in modo sicuro, trasparente e responsabile. Per questo la privacy non è un ostacolo all'innovazione: è una delle condizioni necessarie perché l'innovazione possa esistere. Tuttavia, innovazione e privacy vengono ancora spesso rappresentate come obiettivi in tensione tra loro, come se fosse necessario trovare un compromesso tra le due.

Ma è davvero così?

Esiste una terza strada: sviluppare sistemi di intelligenza artificiale capaci di apprendere senza dipendere direttamente dai dati personali delle persone. Tecnologie progettate per innovare e proteggere la privacy allo stesso tempo.

Sembra impossibile?

Il caso UK Biobank: una buona e una cattiva notizia

Iniziamo con la buona notizia. Uno dei casi recenti più significativi sulla violazione di dati personali è quello della UK Biobank, un enorme progetto di ricerca britannico nato con l'obiettivo di raccogliere dati sanitari, genetici e informazioni sullo stile di vita di circa 500.000 volontari. Da oltre vent'anni questa banca dati rappresenta una risorsa fondamentale per la ricerca medica: grazie alla disponibilità di una quantità così ampia e diversificata di informazioni, scienziati e aziende hanno potuto studiare l'insorgenza di numerose malattie e sviluppare sistemi di intelligenza artificiale in grado di individuare rapidamente correlazioni tra fattori di rischio e patologie. In alcuni casi, questi strumenti hanno consentito di identificare oltre mille condizioni cliniche in tempi molto ridotti.

La cattiva notizia

La stessa ricchezza informativa che rende il database così prezioso può trasformarsi in un rischio per la privacy. Alcuni dati, inizialmente pseudonimizzati per proteggere l'identità dei partecipanti, sono stati infatti re-identificati combinando diverse informazioni presenti nel dataset, dati personali incrociati con altre informazioni. Una volta ricostruita l'identità delle persone, i dati sono comparsi in vendita su Alibaba, una piattaforma di e-commerce cinese. Chi ha rubato queste informazioni (non si è riusciti a risalire ad un colpevole, i giornali parlano di data breach. Succede quando informazioni riservate, come dati sanitari, password, numeri di telefono ecc vengono copiate, rubate o diffuse senza autorizzazione), ha esposto le persone a diversi rischi, come discriminazione. Infatti,  se queste informazioni finissero in mano a soggetti come assicurazioni, datori di lavoro, potrebbero influenzare decisioni importanti: ad esempio premi assicurativi più alti, esclusioni da determinate polizze o difficoltà nell’accesso a opportunità lavorative.

Less is better

Uno dei principi fondamentali del GDPR, il regolamento europeo che disciplina la protezione dei dati personali, è quello della minimizzazione dei dati. In termini semplici, significa che si possono raccogliere e utilizzare solo i dati realmente necessari per raggiungere uno scopo specifico. Il regolamento afferma, infatti, che i dati devono essere adeguati, pertinenti e limitati a quanto necessario rispetto alle finalità per le quali sono trattati. Ed è proprio la parola finalità a essere centrale. Per quale scopo vengono raccolti quei dati? Quando si parla di sanità la finalità deve essere ancora più chiara, perché i rischi sono molto più alti per le persone.

Per esempio, noi di Geen.ai  raccogliamo dati esclusivamente per orientare le persone verso il percorso di cura adeguato. Proprio per questo non ci servono troppi dati ma solo quelli strettamente necessari. Nel caso UK Biobank, le finalità erano buone, i dati infatti hanno permesso di fare ricerca in ambito medico. Tuttavia, il caso ha evidenziato un problema cruciale: quando i dataset diventano estremamente dettagliati e ricchi di informazioni, rimuovere nomi e codici identificativi potrebbe non essere sufficiente a garantire l'anonimato degli individui.

Il professore aveva previsto tutto. Ma tutto tutto?

Immaginate una scena della Casa di Carta. I protagonisti, guidati dal Professore, pianificano nei minimi dettagli la rapina del secolo. Superano sistemi di sicurezza, aggirano gli ostacoli e gestiscono ogni imprevisto perché, come si ripete spesso nella serie, il Professore aveva previsto tutto.

Trasportiamo questa scena nel mondo della sanità digitale. Nel caso della UK Biobank, il "bottino" era rappresentato da una delle più grandi raccolte di dati sanitari al mondo. I dati erano pseudonimizzati, cioè privati di nomi e identificativi diretti. Tuttavia, il database conteneva una quantità enorme di informazioni su salute, genetica e stili di vita. Combinando questi elementi, è stato possibile risalire all'identità delle persone, compromettendone la privacy. In altre parole, il caveau era protetto, ma il bottino era ancora lì dentro.

E se invece, una volta arrivati al caveau, i ladri non trovassero ciò che cercano?

Non perché il bottino non ci sia, ma perché non si trova nel luogo in cui normalmente lo si andrebbe a cercare: un archivio di identità personali.

Il punto non è l’assenza di dati personali, ma dove sta il valore del sistema

In una piattaforma come Geen.ai, durante l’interazione con l’utente vengono trattate informazioni come età, sesso, area geografica, sintomi e dati tecnici di log, gestite nel rispetto del GDPR e protette da adeguate misure di sicurezza. Tuttavia, questo non rappresenta il “bottino”.

Il vero valore non sta nell’accumulare e archiviare dati personali, ma nella struttura di conoscenza che il sistema costruisce: un insieme di relazioni tra sintomi, linee guida cliniche, PDTA, percorsi terapeutici e pattern osservati a livello di popolazione. È questa rete di connessioni che permette al sistema di ragionare e fornire un orientamento sanitario, perché collega tra loro informazioni mediche e le trasforma in conoscenza operativa.

Per questo il “ladro” cerca nel posto sbagliato. Si aspetta un archivio di identità da sottrarre, ma il valore non è in un elenco di persone: è nelle relazioni tra le informazioni, cioè nel modo in cui il sistema organizza e collega la conoscenza clinica.

Innovare o proteggere? Non è un dilemma

Ritornando alla domanda iniziale: innovare o regolamentare? Tecnologie come Geen.ai dimostrano che la tutela della privacy può diventare una caratteristica distintiva del prodotto e non un limite all'innovazione. Il punto non è scegliere tra innovazione e protezione dei dati, ma ripensare il modo in cui i sistemi vengono progettati fin dall’inizio.

Privacy-by-Design

La differenza sta proprio qui: la tutela dei dati non è un provvedimento da adottare a posteriori, una volta che i dati sono stati raccolti o, peggio, dopo che si è verificata una violazione. È un principio che deve essere incorporato nella progettazione stessa del sistema. In questo approccio, la capacità di innovare nasce insieme alla capacità di proteggere, perché la privacy non è un vincolo esterno, ma una componente strutturale del modo in cui il sistema viene costruito e funziona.

//