Open Topics
Available Theses Topics (mostly in German)
Implementation eines Mix-Netzes als SDN
Mix-Netze sind Overlay-Netze, die den Prinzipien eines klassisches Netz entsprechen, d.h. jede Komponente muss einzeln überwacht, instand gehalten und angepasst werden. Sogenannte SDNs (Software-Defined Networks) zählen ebenfalls zu den Overlay-Netzen, bieten jedoch neue Möglichkeiten der Instandhaltung und Anpassung durch die zentrale Kontrolle aller Komponenten. Anforderungen können in SDNs effizienter und flexibler angepasst werden, wodurch sich u.a. die Skalierbarkeit, Fehlertoleranz oder Evaluation neuer Einstellungen einfacher gestaltet.
Bisher bestehende generische Fehlertoleranzmechanismen für verteilte Systeme sind nicht auf Mix-Netze anwendbar. Spezifische Ansätze, die die Fehlertoleranz in Mix-Netzen verbessern, tun dies entweder auf Kosten der Anonymität oder verschieben den Angriffsvektor auf andere Komponenten, die oft einen Single Point of Failure darstellen. Mit der Einführung von SDNs bieten sich neue Möglichkeiten der Fehlerdetektion und -behebung sowie der Angriffsdetektion und -behebung.
Innerhalb dieser Abschlussarbeit soll
- ein Mix-Netz als SDN implementiert werden,
- neue Möglichkeiten der Fehlertoleranz für dieses Netz betrachtet werden,
- eine Evaluation hinsichtlich Anonymität und Verfügbarkeit des Netzes erfolgen.
Studie zur Akzeptanz anonymsierter Statistiken
Um die datenschutzrechtlichen Einschränkungen beim Teilen von Statistiken zu reduzieren oder zu vermeiden, muss der Personenbezug durch geeignete Anonymisierungsverfahren aufgehoben werden. Die einfache Aggregation der Daten reicht im Allgemeinen dafür nicht aus, da Rekonstruktionsangriffe durch die Überlappung der Statistiken sowie das Vorwissen des Eingreifers umfangreiche Rückschlüsse über die Datenpunkte erlauben können. Schutztechniken wie Microaggregation, Zellsperrungen, die Cell-Key-Methode oder Differential Privacy führen jedoch einen zusätzlichen Fehler ein, welcher die Nützlichkeit der Statistiken beeinträchtigt. Bei einigen Verfahren kann dieser Fehler quantifiziert und so bei der Auswertung der Statistiken berücksichtigt werden.
Ziel der Studie ist die Identifizierung von Hindernissen und Missverständnissen bei Nutzung anonymisierter Statistiken. Die Studie soll ermitteln, ob sich die Studienteilnehmenden der Risiken ungeschützter Statistiken bewusst sind, ob sie mit anonymisierten Statistiken ausgewählte Nutzungsszenarien erfolgreich bearbeiten können und ob sie dabei die Auswirkungen der Schutztechniken auf die Ergebnisse der Szenarien richtig abschätzen können. Die Nutzungsszenarien sollen dabei die typsiche Nutzung von veröffentlichter Statistiken - idealerweise innerhalb der medizinischen Forschung - widerspiegeln.
Automatischer Vergleich zwischen Protokollbeschreibung und Code - Implementation
In der Kryptographie werden oft bestimmte Protokolleigenschaften wie z.B. die Sicherheit von personenbezogenen Daten theoretisch bewiesen. Bei der Umsetzung in praktischen Programmcode können allerdings Fehler passieren, die für unerwartete Sicherheitslücken sorgen. Es gibt bereits verschiedene Tools, die unter anderem mit Hilfe von künstlicher Intelligenz die Korrektheit von Programmcode beurteilen sollen (z.B. [PSS98;Kan+20;Sam+21]). Es wirkt naheliegend, darauf aufbauend auch automatisch prüfen zu wollen, ob der Programmcode einer gegebenen Protokollspezifikation entspricht. In einer Vorarbeit wurden bereits mögliche Anforderungen an ein Tool aufgestellt, das eine Protokollbeschreibung und den zugehörigen Code vergleicht. Zusätzlich wurden mehrere Techniken herausgearbeitet, die dafür genutzt werden könnten.
Diese Arbeit soll einen Prototypen des Tools implementieren und anhand der gegebenen Anforderungen sowie weiterer Metriken evaluieren. Die konkrete Auswahl der Techniken ist dabei freigestellt, sollte jedoch sinnvoll begründet werden. Nach Möglichkeit sollen verschiedene Techniken getestet und miteinander verglichen werden. Ebenfalls kann eine rein KI-basierte Variante des Tools als Vergleich implementiert werden.
Referenzen:
[PSS98] Amir Pnueli, O Shtrichman, and M Siegel. The Code Validation Tool(CVT). In: International Journal on Software Tools for Technology Transfer(STTT) 2.2 (1998), pp. 192–201.
[Sam+21] Michael Sammler et al. RefinedC: automating the foundational verification of C code with refined ownership types. In: Proceedings of the 42nd ACM SIGPLAN International Conference on Programming Language Design and Implementation. PLDI 2021. Virtual, Canada: Association for Computing Machinery, 2021, pp. 158–174.
Towards Retrospective Anonymization of Machine Learning Models
The widespread use of machine learning (ML) models trained on personal data has lead to privacy concerns. With its Opinion 28/2024, the European Data Protection Board (EDPB) has extended the concept of anonymity to ML models and has defined criteria an anonymized ML model must meet. One of these criteria is that the model must be robust to membership inference attacks (MIAs): An attacker must not be able to predict (with high confidence) whether an individual's data has been used to train the model. The traditional ways to prevent such an attack - for instance differential privacy - must be applied during the model's training phase. Opinion 28/2024, however, permits that an already trained model is anonymized in retrospect. Such a retrospective anonymization would simplify the re-use of existing models in other application contexts without a repetition of the expensive training step.
The objective of this thesis is to design and implement an algorithm that protects a trained ML model from MIAs without requiring access to the original training data. Possible steps could include regularization, machine unlearning, query restrictions or using the original model as a foundation model in another round of training against MIAs. The algorithm should be evaluated quantitatively by a comparison with a suitable baseline such as traditional countermeasures or the unprotected model. This evaluation should include both the privacy (defined as the success rate of MIAs) and utility (for instance defined by an ROC curve).
Implementierung und Evaluation eines anonymen CTI-Sharing-Systems für kritische Infrastrukturen
Organisationen die zu kritischen Infrastrukturen gehören, müssen besonders vor Cyberangriffen geschützt werden. Dabei hilft der Austausch von Cyber Threat Intelligence (CTI), um Angriffe frühzeitig zu erkennen und kollektive Abwehrmaßnahmen zu koordinieren. Existierende Sharing-Plattformen wie MISP übertragen Bedrohungsdaten jedoch so, dass aus Verbindungsmetadaten auf den Absender geschlossen werden kann. Wer eine Schwachstelle meldet, verrät damit, welche Systeme er betreibt und dass er kompromittiert wurde. Für Unternehmen im Wettbewerb entstehen dadurch Risiken, die in der Praxis dazu führen, dass relevante CTI unter Umständen zurückgehalten wird.
Anonyme Broadcast-Protokolle auf Basis von DC-Netzen und Distributed Point Functions (DPFs) bieten kryptographisch beweisbare Sender-Anonymität für Broadcast-Szenarien. Diese sind jedoch für anonyme broadcast Nachrichten, ohne Schutz gegenüber falschen oder böswilligen Einträgen der Teilnehmer ausgelegt, und wurden bisher nicht auf den CTI-Anwendungsfall übertragen. Verantwortlichkeit der Teilnemer für ihre Nachrichten und heterogene Datenformate (STIX/TAXII) müssen mit Anonymität vereint werden.
Im Rahmen dieser Abschlussarbeit soll
- ein anonymer CTI-Sharing-Prototyp auf Basis eines DC-Protokolls (Spectrum) implementiert werden, der anonymes Einbringen von STIX-Bundles durch eine beliebige Anzahl an Teilnehmern einer definierten Gruppe ermöglicht,
- ein Mechanismus zur dynamischen und Anonymen Schreibrechtevergabe entworfen und integriert werden,
- die Anonymitätseigenschaften des Systems bewertet werden, sowie eine Leistungsmessung hinsichtlich Latenz, Durchsatz und Skalierbarkeit in Abhängigkeit von Teilnehmerzahl und Datenvolumen erfolgen.