Welche Daten werden eigentlich in KI:connect verarbeitet?

Von Malte Persike Mai 22, 2025

Bei der Planung von KI:connect war der Schutz der persönlichen Daten unserer Nutzenden eines unserer wichtigsten Ziele. Erfahren Sie mehr darüber, was das System über unsere User weiß.

Deshalb war von Beginn an klar: Personenbezogene Daten schützt man am besten, wenn man sie gar nicht erst erhebt. Dieser Artikel beschreibt, welche personenbezogenen Daten bei der Nutzung von KI:connect überhaupt verarbeitet werden und zu welchen Zwecken das passiert.

Daten ohne Personenbezug

Wenn unsere User Nachrichten an die hinterlegten KI-Modelle schicken, werden natürlich die Nachricht selbst und einige Metadaten übertragen und in KI:connect gespeichert. Diese erlauben aber keinen Personenbezug, solange sich unsere User an die Nutzungsbedingungen halten und keine personenbezogenen Daten in ihre Prompts eingeben.

Konkret werden beim Abschicken eines Prompts folgende Daten verarbeitet:

  1. Eingabedaten der Nutzenden (insb. sog. Prompts);
  2. Ausgabedaten der KI-Modelle (insb. sog. Completions);
  3. anonyme Identifikationsnummer (ID) des Chats;
  4. anonyme Identifikationsnummer (ID) eines Elementes in diesem Chat (insb. Eingabedaten und Ausgabedaten);
  5. Zeitstempel des Elements;
  6. übertragene Tokenzahl der Eingabedaten und der Ausgabedaten;
  7. genutztes KI-Modell;
  8. anonyme Identifikationsnummer (ID) des zugehörigen Kostenelements;
  9. die Kosten selbst.

Welche personenbezogenen Daten werden verarbeitet?

Bei den personenbezogenen Daten gibt es drei Kategorien, die aus unterschiedlichen Gründen verarbeitet werden:

Kategorie 1: Daten, die im Rahmen der Single Sign On Anmeldung übertragen werden. Diese sind:

  1. Eine pseudonyme ID zur Person, die sich nicht ändert;
  2. Rolle bzw. Gruppe der Person, z.B. “Staff” oder “Student”;
  3. Art der Zugehörigkeit zur eigenen Organisation;
  4. Domain der eigenen Organisation.

Kategorie 2: Ferner werden Daten als Teil der Browsersession verarbeitet. Diese sind:

  1. Von der Person im Identity Management der eigenen Hochschule festgelegter Rufname;
  2. Nachnamen;
  3. Dienstliche E-Mail-Adresse.

Kategorie 3: Schließlich wird bei der Nutzung der Webseite ein Authentifizierungs-Cookie gesetzt. Dieser enthält:

  1. Shibboleth Session-ID;
  2. Einstellungen zur Cookie-Policy;
  3. IP-Adresse des Endgeräts der Person;
  4. ID des Dienstes KI:connect.nrw.

Wo werden die Daten gespeichert?

Das klingt erst einmal nach gar nicht so wenigen personenbezogenen Daten, die bei der Nutzung von KI:connect anfallen. Wichtig ist aber, wo und wofür die Daten übertragen werden.

Entscheidend sind hier zwei Dinge. Erstens werden die drei Kategorien personenbezogener Daten zu keiner Zeit zwischen den Kategorien verknüpft. Insbesondere wird die pseudonyme ID der Person nicht mit Daten aus den Kategorien 2 und 3 verknüpft, also zum Beispiel mit dem Namen oder der E-Mail-Adresse einer Person. KI:connect “kennt” und vearbeitet auf seinen Servern also niemals den Namen, die E-Mail-Adresse oder andere personenbezogene Daten, die zu einer pseudonymen ID gehören.

Keine User-Accounts – nur eine pseudonyme ID

Zweitens legt KI:connect keine Accounts für unsere Nutzenden an. Es gibt als auf den KI:connect Servern keine Datenbank mit dem Namen “user” oder ein ähnliches Konstrukt. Die pseudonyme ID zur Person gemäß Kategorie 1.a wird genau an einer Stelle im System gespeichert, nämlich ausschließlich als Teil einer Konversation.

Das ist auch der Grund dafür, warum KI:connect noch keine User-Einstellungen anbietet, z.B. das KI-Modell, mit dem die Web-Oberfläche nach dem Login startet oder ein Avatarbild zur Person. Es gibt in KI:connect schlichtweg keinen Ort, an dem solche Informationen gespeichert werden könnten, weil wir keine User-Accounts anlegen.

Kostenelemente

Bleiben noch die drei anderen Datenfelder der Kategorie 1, die bei der Anmeldung übertragen werden: die Rolle der Person, ihre Zugehörigkeit und die Domain der eigenen Organisation. Diese ermöglichen die Zuordnung der pseudonymen ID zu so genannten Kostenelementen. Ein Kostenelement ist eine spezifische Kombination von KI-Modell, Limits, Rolle, der Organisation und einer dort existierenden Kostenstelle. Ein Kostenelement könnte z.B. so aussehen:

ID: "Kostenelement-4835849384"
Organisation: "RWTH Aachen"
Rolle: "student"
Kostenstelle: "Lehrstuhl-403-3023-4470
KI-Modell: "o4-mini-2025-04-16"
Limits: "100 Prompts / 3 h"

Die ID dieses Kostenelements wird gemeinsam mit der pseudonymen ID der Person in jedem Chat gespeichert. Weitere personenbezogene Daten fallen in KI:connect nicht an.

Wo bleiben die übrigen Daten?

Alle anderen Daten, also die Daten der Kategorien 2 und 3 verbleiben auf den Geräten unserer Nutzenden und finden nie den Weg auf die Server von KI:connect. Sie werden entweder in einem Cookie-gespeichert, der nach höchstens 24h gelöscht wird, oder sie sind Teil der Browsersession, die mit dem Schließen des Browsers verschwindet.

Konsequenzen für den Logout aus KI:connect

Aufgrund dieser Datensparsamkeit ist auch die Abmeldung von KI:connect etwas ungewöhnlich. Weil KI:connect auf seinen Servern keinerlei Informationen zur aktiven Anmeldung auf unseren Servern speichert, sondern alle entspreichenden Daten auf den Geräten der User verbleiben, kann KI:connect eine aktive Anmeldung nicht selbst beenden. Das können nur unsere User selbst, indem sie die Informationen zur laufenden Session im eigenen Browser löschen.