Seminario AI Lab | Introduzione alla Differential Privacy
Con l'aumentare della quantità di dati raccolti e usati dalle organizzazioni per le attività di analisi, crescono anche le preoccupazioni relative alla privacy e alla sicurezza. Se per le attività di analisi vengono usate informazioni personali, è particolarmente importante che i dati rimangano privati per tutto il periodo di utilizzo. Il risultato stesso dell'analisi non deve rivelare informazioni personali: non deve cioè essere possibile dedurre la presenza di un particolare record tra quelli a partire dai quali il risultato è stato calcolato.
Secondo la definizione di differential privacy, il risultato di un'analisi è privato se non dipende dalla presenza di un singolo individuo nel database di partenza. In altre parole, le analisi devono essere fatte in modo tale da assicurare che aggiungendo o togliendo i dati di un singolo individuo il risultato rimanga all'incirca lo stesso. Nel seminario vedremo un'introduzione alla definizione di differential privacy e alle principali tecniche che si possono usare per modificare un algoritmo in modo che il suo output rispetti tale definizione. Infine, cercheremo di capire quali sono le potenzialità di questa definizione e quali invece i suoi limiti.
Seminario a cura di
Elena Battaglia
PHD Student in Computer Science Università degli Studi di Torino