So einzigartig
wie ein Fingerabdruck
(17.07.2023) Oft wird gesagt, der Datenschutz verhindert die Nutzung von medizinischen Daten. Mit besseren Anonymisierungsverfahren wäre beides möglich.
Die Verfügbarkeit medizinischer Daten ist wesentlich für die medizinische und pharmazeutische Forschung, sowohl an Forschungsinstituten als auch in der Industrie. Auch für das Trainieren von Anwendungen, die auf künstlicher Intelligenz beruhen, sind große Datenmengen nötig. Datenschützer warnen jedoch vor dem Risiko der unbefugten Nutzung solcher Daten. So seien personenbezogene medizinische Daten in ihrer Kombination einzigartig wie ein Fingerabdruck, sagt der Verein Patientenrechte und Datenschutz e. V. in einem kürzlich veröffentlichten Appell zum EU-Vorschlag eines „Europäischen Gesundheitsdatenraums“.
Die Datenschützer weisen darauf hin, dass man durch Zusammenführung von Daten aus verschiedenen Quellen die betreffende Person aktuell aus fast jedem „anonymisierten“ Datensatz identifizieren könne. Zudem nehmen die Möglichkeiten zur umfassenden medizinischen Datensammlung zu – beispielsweise über Register, die elektronische Patientenakte, digitale Gesundheitsanwendungen, Apps, Smartwatches und weitere Medizinprodukte. „Überdies kann ‚Pseudonymisierung‘ rückgängig gemacht werden.“ Um missbräuchlicher Datennutzung entgegenzutreten, schlägt der Verein unter anderem vor, Sekundärnutzung streng auf gemeinnützige Forschung zu beschränken und eine Daten-Weitergabe unter empfindliche Strafen zu stellen.
So wie es etwa das Land Mecklenburg-Vorpommern mit einer Änderung des Landeskrankenhausgesetzes vorhat. Vor Ort erhobene Gesundheitsdaten dürfen demnach nur zu Forschungszwecken verwendet werden (deutschlandweit), eine Veräußerung an Dritte ist ausgeschlossen. Auch der Landesdatenschutzbeauftragte ist zufrieden: „Nur wenn Patientinnen und Patienten begründet darauf vertrauen können, dass ihre personenbezogenen Daten im Einklang mit den datenschutzrechtlichen und technischen Vorgaben verarbeitet werden, wächst ihre Bereitschaft, Forschung zu unterstützen.“
Risiken der Re-Identifizierung aus EEG-Daten
Oder man verbessert die Anonymisierung medizinischer Daten gleich generell. Dem hat sich das BMBF-geförderte „Forschungsnetzwerk Anonymisierung für eine sichere Datennutzung“ verschrieben und unterstützt dabei mehrere Kompetenzcluster und Forschungsprojekte, die den technischen Datenschutz verbessern wollen.
Im Projekt NEMO etwa geht es um Anonymisierungsverfahren von Elektroenzephalogramm (EEG)-Daten aus Schlafüberwachungssystemen. Federführend für das bis Dezember 2025 mit zwei Millionen Euro geförderte Projekt ist das Fraunhofer-Institut für Digitale Medientechnologie (IDMT) in Oldenburg. „Aktuelle Publikationen deuten darauf hin, dass personenbeziehbare Merkmale aus einem EEG extrahiert werden können [...]. Zugleich lassen sich aus den Daten relevante Informationen zum Gesundheitszustand ableiten und zukünftig möglicherweise auch Marker zur Früherkennung von Krankheiten. Auch im Consumer-Bereich finden sich mittlerweile Geräte, die EEG-Daten erheben“, erläutert Insa Wolf, Gruppenleiterin Mobile Neurotechnologien am Fraunhofer-IDMT, in einer aktuellen Pressemitteilung. Gemeinsam mit den Kollegen des Ilmenauer IDMT-Standorts möchte Wolf im Projekt NEMO konkrete Risikoszenarien zur Re-Identifizierung aufdecken und anschließend neue Algorithmen für die Anonymisierung von EEG-Daten entwickeln. „Wenn wir erfolgreich sind, können die Ergebnisse auch für vergleichbare Biosignaldaten und andere Gebiete der Gesundheitsforschung äußerst hilfreich sein“, ergänzt Patrick Aichroth vom Fraunhofer-IDMT in Ilmenau.
Mehr Privatsphäre
Ganz allgemein um Verfahren und Methoden zur Anonymisierung von medizinischen Anwendungen geht es im Projekt AnoMed unter Leitung von Esfandiar Mohammadi vom Institut für IT-Sicherheit der Universität zu Lübeck. Das bis November 2025 mit zehn Millionen Euro geförderte Projekt will eine Plattform mit medizinischen Referenzaufgaben für Referenzdatensätze zur Verfügung stellen, für die die internationale Forschungsgemeinschaft Privatsphäre-bewahrende Datenverarbeitungsprozesse entwickeln kann.
Denn derzeit verfügbare Anonymisierungslösungen wie k-Anonymität sind für die meisten medizinischen Anwendungen nicht nutzbar, da sie nicht genug vor Angreifern mit starkem Hintergrundwissen, zum Beispiel über eine spezielle Studie, schützen. „Ein Fokus unserer Forschung ist die Entwicklung von Privatsphäre-bewahrenden maschinellen Lernverfahren. Ein von uns entwickeltes Clustering-Verfahren, zum Beispiel, gruppiert bei einem tabellarischen Datensatz Datenpunkte – also Zeilen – mit ähnlichen Kombinationen an Tabelleneinträgen. Das Verfahren ist beweisbar Privatsphäre-erhaltend und damit auch auf schützenswerte Daten verantwortungsbewusst anwendbar, und es soll bald für die Erstellung künstlicher Daten genutzt werden“, berichtet IT-Experte Mohammadi. „Komplementär erarbeiten wir zusammen mit der Forschungsabteilung des Unabhängigen Landeszentrums für Datenschutz Schleswig Holstein gerade interdisziplinär, inwiefern das Nutzen von Privatsphäre-bewahrenden Datenverarbeitungsprozessen der Erfüllung von rechtlichen Datenschutzauflagen dienen kann.“
Toolbox für die Anonymisierung
Das Charité Lab for AI in Medicine arbeitet als Partner im Projekt ANONY-MED unterdessen an einem „einheitlichen Werkzeugkasten mit Methoden für die Anonymisierung von unterschiedlichen medizinischen Daten“. Verbundkoordinator des bis Dezember 2025 mit 1,5 Millionen Euro geförderten Projekts ist das Fraunhofer-Institut für Angewandte und Integrierte Sicherheit (AISEC) am Standort Berlin.
Die Wissenschaftler verwenden zum einen künstliche Datenerzeugung mit generativen Modellen, womit man auf künstlicher Intelligenz basierende Modelle zur Diagnostik trainieren kann. Zum anderen werden die generierten Daten einer datenschutzkonformen Analyse mithilfe von sogenannter homomorpher Verschlüsselung unterzogen. Auf diese Weise lassen sich mit Daten Berechnungen ausführen, ohne dass sie vorher entschlüsselt werden müssen. Getestet werden soll der kombinierte Ansatz an Anwendungsfällen aus der Radiologie, Kardiologie und der Schlaganfalltherapie. „Darüber hinaus können die entwickelten Methoden perspektivisch auch in anderen Anwendungsgebieten eingesetzt werden, um sensible Datenbestände rechtskonform zu nutzen.“
Bettina Dupont
Bild: Pixabay/Mikes-Photography
Weitere Artikel zum Thema Forschungsdaten
- Durchs Portal zum Datenschatz
Über das neue Forschungsdatenportal für Gesundheit erhalten Wissenschaftler ab 2023 Zugang zu Routinedaten von Unikliniken und Bioproben.
- Datensätze sind Datenschätze!
„Die Daten sind da, doch niemand kann sie nutzen“. In Zukunft soll das Zusammenspiel zwischen Forschung und Gesundheitswesen besser klappen.
- Eine europäische Wolke fürs Datenteilen
Seit 2015 schwebt sie über uns. Nun befindet sich die European Open Science Cloud „in der Anfangsphase ihrer Umsetzung“, berichtet Dale Robertson.