Betere privacy garanties door gedecentraliseerde data

Jonas Braadbaart is Machine Learning engineer en neemt je tijdens zijn sessie mee in de mogelijkheden van Federated Learning. Een nieuwe technologie die volgens Jonas de vele privacy issues die Machine Learning meeneemt oplost. Een vaak gehoorde kanttekening van Machine Learning is namelijk dat het vaak privacygevoelig is. Machine Learning wordt meestal toegepast op Big Data, waarbij veel data op één grote hoop gegooid wordt, waar de modellen vervolgens op worden getraind. Bij Federated Learning zit dit anders in elkaar, de modellen worden dan getraind op lokaal opgeslagen data.

Veel bedrijven slaan hun data centraal op, alle gegevens worden op één locatie bewaard en dit is vaak toegankelijk voor een groot deel van de medewerkers. Een gevaar van een lek van persoonsgegevens ligt hierbij altijd op de loer, wat weer kan leiden tot phishing attacks of identiteitsfraude. Dat dit mis kan gaan is al gebleken bij grote bedrijven als Facebook en LinkedIn, maar ook in Nederland lagen bij de GGD onlangs flink wat persoonsgegevens op straat.

MODELLEN TRAINEN OP LOKALE DATA

Jonas legt uit dat Machine Learning niet altijd op gecentraliseerde grote hopen van data toegepast hoeft te worden. Bij Federated Learning wordt data namelijk lokaal opgeslagen (bijvoorbeeld op je telefoon), en hier wordt een model op getraind en een voorspelling gegeven. Wanneer er dan data lekt is de schade beperkt en liggen niet meteen de gegevens van alle gebruikers op straat. Op deze manier ligt de data van een gebruiker niet bij een groot concern maar blijft deze bij de gebruiker.

Ontwikkelingen van de afgelopen 5 jaar in Federated Learning

empower the organization through connection

WAAR ZIEN WE DIT AL?

Federated Learning is een technologie die pas enkele jaren bestaat. Wereldwijd zijn er verschillende onderzoekers en ontwikkelaars bezig om deze Federated technologieën te verbeteren, verfijnen en toe te passen. Op dit moment wordt Federated Learning met name op mobiele telefoons gebruikt, door bijvoorbeeld Google Keyboard. Het toetsenbord onthoudt jouw woordencombinaties en emojigebruik. Zo leert het model van eigen data en kan de gebruiker suggesties geven van woorden en emoji’s.

De technieken zijn er, maar de wil en de motivatie is er nog niet. Men heeft een big data mind set, maar hier moet volgens Jonas verandering in komen. De tip van Jonas is om altijd na te kijken na of data überhaupt wel centraal opgeslagen moet worden. Als dat niet het geval is, dan is Federated Learning de oplossing om je modellen mee te trainen.

In de sessie van Jonas gaat hij dieper in op de technologie en legt hij ook het principe van differential privacy en Cross-Silo Federated Learning uit. Vervolgens kun je de Q&A van Patrick Barbier bekijken. Ben je benieuwd naar de volledige sessie? Vraag deze dan aan via het formulier!

Innovation Event 2021 - Sessies terugkijken

  • Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.

DEEL DIT BERICHT IN JE NETWERK:

MEER LEZEN?

Bekijk hier alle blogs.

Alle blogs