Bis zum 15. Dezember 2012 ist mein Projekt Browser Fingerprinting online. Im Rahmen meiner Diplomarbeit sammel ich Identifizierungsmerkmale von Computer- und Browserkonfigurationen, denn: jede und jeder im Internet hinterlässt bei einem Webseitenaufruf eine Art „Fingerabdruck“. Diese relativ neue Art der Identifizierung soll wissenschaftlich beleuchtet werden, um im Anschluss Schutzmaßnahmen entwickeln zu können.

Hinweis: Diplomarbeit ist online. Hier entlang!

Seit es das World Wide Web gibt, gibt es Bestrebungen von Webseitenbetreiber/innen (Content-Provider) ihre Besucher/innen zu identifizieren bzw. sie bei einem erneuten Besuch wiederzuerkennen. Auch für den/die Anwender/in ergeben sich Vorteile: falls er/sie von der Website erkannt wird, entfällt ein erneuter Login (z. B. bei sozialen Netzwerken). Kleine Textdokumente, die auf dem Computer des Besuchers bzw. der Besucherin abgelegt werden (sog. Cookies), erfüllen seit den 1990er Jahren diese Funktion. Doch dies ist nicht der einzige Einsatzzweck vom Cookies: Werbedienstanbieter verwenden Cookies, um dem/der Betrachter/in maßgeschneiderte Werbung anbieten zu können. Dabei wird bei dem ersten Aufruf einer Website, die ein von einem Dienstleister bereitgestellten Werbebanner enthält, ein Cookie mit einer eindeutigen Nummer hinterlegt. Besucht er/sie weitere Websites, die solch einen Banner enthalten, kann anhand dieser Nummer eine Chronik der besuchten Websites erstellt werden, da dieser Cookie jedes Mal übertragen wird und so die eindeutige Nummer ausgelesen werden kann. Nach einer gewissen Zeit kann somit ein relativ genaues Interessensprofil erstellt werden.

Doch was geschieht, wenn das Cookie gelöscht wird? In diesem Fall ist es nicht mehr möglich, die Person zu identifizieren und die Surfchronik muss komplett neu erstellt werden. Manche Nutzer/innen haben die Speicherung von Cookies generell deaktiviert, somit funktioniert der gesamte Ansatz nicht.

In diesen Fällen müssen neue, alternative Ansätze versucht werden. Dabei können einerseits sog. Super-Cookies verwendet oder es werden identifizierende Elemente der Systemkonfiguration des Nutzers bzw. der Nutzerin abgefragt und ausgelesen, gespeichert und verglichen.

So sendet jeder Webbrowser automatisch bei jedem Aufruf einer Website eine Kennung des verwendeten Browsers und dessen Version mit. Über alltägliche Web-Skriptsprachen, wie z. B. JavaScript, lassen sich die verwendeten Systemfarben (z. B. Desktop-Hintergrund) abfragen und Flash kann dazu verwendet werden, alle installierten Schriftarten aufzulisten. Diese Kombination der Daten ist u. U. auf der Welt einzigartig (weil er/sie einen hellrosa Hintergrund eingestellt hat und eine Disney- und Star-Wars-Schriftart installiert hat). Wenn jemand die Website also erneut mit genau dieser Konfiguration aufruft, ist mit hoher Wahrscheinlichkeit davon auszugehen, dass es sich um die gleiche Person handelt. Schriftarten und Systemfarben sind dabei nur ein Teil von Daten die ohne weiteres von jeder Website abgefragt werden können!

In meiner Diplomarbeit möchte ich dieses relativ neue und wissenschaftlich kaum bis gar nicht beleuchtete Thema genauer analysieren. Dazu habe ich eine Website erstellt, die möglichst viele Daten sammelt. Es geht dabei um die Fragestellungen: Wie verlässlich ist die Identifizierung über Konfigurationsmerkmale? Wie eindeutig sind bestimmte Konfigurationsmerkmale (welche haben eine höhere/niedrigere Signifikanz)? Daraus folgt die Frage: benötigt der/die Anwender/in einen Schutz und wenn ja, wie kann dieser aussehen?

Sie finden das Projekt hier. Ich würde mich freuen, wenn Sie daran teilnehmen und andere darauf aufmerksam machen. Das Projekt läuft bis zum 15.12.2012. Die gesamte Arbeit mit den ermittelten Daten wird im Anschluss auf dieser Seite öffentlich zugänglich sein (nach Open Science / Open Access Prinzipien). Mögliche identifizierende Merkmale (z. B. die Namen der Schriftarten) werden anonymisiert.

Vielen Dank für Ihre Unterstützung!

*) Fingerprint (image), CC-BY-SA Wilfredor, Wikipedia