N = tutti, o del non perdersi fra i dati

A completamento del post precedente sul libro di Viktor Mayer-Schönberger e Kenneth Cukier Big Data, ecco che cosa gli autori aggiungono a proposito dei rischi insiti nell’uso dei big data e dei possibili rimedi.

“Il pericolo di non governare i big data nel rispetto della privacy, o di farsi ingannare dal significato dei dati, va molto al di là di bazzecole come la pubblicità mirata su Internet. La storia del XX secolo è fin troppo ricca di situazioni in cui i dati hanno prodotto risultati sanguinosi. Nel 1943 lo U.S. Census Bureau cedette in blocco alle autorità militari gli elenchi nominativi (ma senza l’indirizzo e il numero civico, in modo da salvare le apparenze) dei nippo-americani per facilitarne l’internamento. I registri anagrafici proverbialmente super aggiornati dell’Olanda vennero usati dagli invasori nazisti per rastrellare gli ebrei. I numeri a cinque cifre tatuati sull’avambraccio degli internati nei campi di concentramento nazisti corrispondevano inizialmente ai numeri registrati con la scheda perforata di Hollerith che fece la fortuna dell’IBM; la processazione dei dati agevolò la carneficina organizzata.” (p. 205)

In sostanza, gli autori individuano tre aree di rischio piuttosto importanti:

“Anche qui, il punto essenziale sui big data è che un cambiamento nella dimensione porta a un cambiamento della situazione. Come vedremo, questa trasformazione, oltre a rendere molto più problematica la tutela della privacy, porta con sé una minaccia totalmente nuova: le penalizzazioni basate sulle propensioni. Ovvero della possibilità di usare le previsioni che emergono dai big data sulle persone per giudicarle e punirle ancor prima che agiscano. Ed è la negazione dei concetti di equità, giustizia e libero arbitrio.
Esiste poi un terzo pericolo, oltre a quelli che si profilano per la privacy e per le propensioni. Rischiamo di cadere vittime di una dittatura dei dati, in base alla quale eleviamo a feticcio le informazioni, l’output delle nostre analisi, e finiamo per farne un cattivo uso. Se gestiti razionalmente, i big data sono un utile strumento per la razionalizzazione del processo decisionale. Se gestiti impropriamente, rischiano di diventare uno strumento al servizio dei potenti, che potrebbero farne un mezzo di repressione, limitandosi a creare frustrazione nei clienti e nei dipendenti o, peggio, danneggiando i cittadini.” (p. 204)

La prima area di rischio è dunque costituita dalla privacy. Dallo scandalo NSA in poi (credevamo che Assange fosse un paranoico, adesso sembra un’anima candida), questo è l’elemento che più intuitivamente si impone all’attenzione. La verità, purtroppo, è che coi big data la privacy – per come la concepiamo oggi – semplicemente non esiste più.

La normativa attuale che si occupa della protezione dei dati si basa sull’idea del consenso concesso dall’interessato volta per volta, rispetto al singolo contesto in cui avverrà il trattamento dei suoi dati, pratica che lo dovrebbe garantire da abusi e dovrebbe riservargli un’area di libero arbitrio considerata fino a oggi sufficiente. Quando poi si intende utilizzare i dati per macro analisi, aggregandone grandi quantità, interviene la procedura dell’anonimizzazione: la malattia che avete avuto nell’ultimo anno verrà conteggiata insieme a quelle di tutti gli altri cittadini, ma senza che ci resti attaccata un’etichetta col vostro nome.
Ma sorgono almeno due problemi: l’autorizzazione al trattamento dei dati è prevalentemente concessa per forza (pena l’esclusione da un servizio, ad esempio), con uno scarso livello di comprensione del suo significato e sempre più spesso come formalità senza importanza (giusto una casella da spuntare che si frappone tra noi e l’obiettivo). Ma soprattutto, la pratica di rendere anonimi i dati viene vanificata dal fatto di disporre di set di dati enormi:

“In presenza di un quantitativo sufficiente di dati, la totale anonimizzazione è assolutamente impossibile. Come se non bastasse, i ricercatori hanno dimostrato che non solo i dati convenzionali, ma anche il grafico sociale – le interconnessioni tra le persone – sono vulnerabili alla de-anonimizzazione.” (p. 210)

Per la seconda area di rischio, quella delle penalizzazioni basate sulle propensioni, sono gli autori stessi a citare l’esempio di Minority Report, il film basato sull’ipotesi di una polizia futuribile che tenta di impedire gli omicidi prima che vengano commessi.
Fantascienza a parte, si può pensare al settore assicurativo per capire che cosa questo punto significhi: immaginate di appartenere per caso a una classe demografica o sociologica che presenta una correlazione statistica importante con un comportamento a rischio, o ancora con una malattia. Come reagireste se vi venisse negata un’assicurazione sulla base di questo e non del vostro comportamento o del vostro stato di salute reali?

La terza area di rischio, quella che gli autori chiamano della possibile dittatura dei dati fa l’ipotesi del caso in cui i dati siano di cattiva qualità, vengano analizzati impropriamente o misurino l’indicatore sbagliato. Ci sono esempi storici di tutto ciò, come ad esempio il famigerato uso del body count (la contabilità dei nemici uccisi) che Robert McNamara fece durante la guerra del Vietnam per misurare il grado di avvicinamento alla vittoria militare, e che con gli anni fu riconosciuto – cinismo del metodo a parte – come dato falsato in primo luogo dai generali statunitensi per motivi di carriera.

“… i big data consentono una maggiore sorveglianza sulla nostra vita, e rendono praticamente obsoleti alcuni degli strumenti giuridici finalizzati alla tutela della privacy. Mandano in soffitta anche il metodo tecnico principale per la protezione dell’anonimato. E, cosa non meno inquietante, le previsioni sugli individui ricavate dai big data si potrebbero usare, di fatto, per punire le loro propensioni, anziché le loro azioni. Questo meccanismo perverso nega il libero arbitrio e intacca la dignità umana.
Nello stesso tempo, c’è il rischio reale che i benefici offerti dai big data spingano le persone ad applicare le tecniche dove non si addicono perfettamente alla situazione specifica, o a fidarsi un po’ troppo dei risultati delle analisi. Man mano che miglioreranno le previsioni estrapolate dai big data, la prospettiva di utilizzarle diverrà sempre più irresistibile, alimentando un’autentica ossessione per i dati, apparentemente giustificata dalla loro ‘onnipotenza’. Ecco di nuovo la maledizione di McNamara e la lezione che ci viene dalla sua storia.” (p. 228)

Di fronte a un quadro così complesso, gli autori sostengono la necessità di nuove forme di regolazione.

Rispetto alla privacy, un quadro normativo e delle sanzioni che spostino la responsabilità reale del trattamento dei dati dagli individui alle organizzazioni, “meno focalizzato sul consenso individuale al momento della raccolta e più incentrato sulla responsabilizzazione degli utilizzatori per quello che fanno.“ (p. 233)

Quanto al rischio della penalizzazione dei singoli sulla base delle loro propensioni, si sostiene che, nell’era dei big data, “dovremo espandere il nostro concetto di giustizia, e pretendere che includa salvaguardie per il libero agire umano così come oggi esigiamo il pieno rispetto delle procedure.” Dunque maggiore trasparenza (“mettere a disposizione i dati e l’algoritmo sottostanti alla previsione che coinvolge l’individuo”, p. 238), un sistema di certificazione degli algoritmi e procedimenti formalmente riconosciuti per la loro confutabilità.

L’unica strada da non prendere? Quella della limitazione a priori dello sfruttamento delle potenzialità dei big data:

“Con il passare dei secoli, abbiamo optato per il sempre maggiore ampliamento dei flussi informativi, e ci siamo abituati a prevenirne gli eccessi non più attraverso la censura, ma tramite regole che limitassero l’uso improprio delle informazioni.” (p. 232)

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...