Kosten

Bei aktuellen KI-Diensten dominieren zwei Abrechnungsmodelle:

  1. Abrechung auf Account-Basis: Für jeden User in einer Einrichtung wird ein Pauschalbetrag für einen vorgegebenen Zeitraum erhoben, üblicherweise auf Monatsbasis. Typische Tarifoptionen liegen bei 10-20,- € pro User, so dass bereits bei kleineren Hochschulen erhebliche Gesamtkosten generiert werden, die den Hochschulhaushalt in der Regel deutlich überfordern.

  2. Abrechung auf Token-Basis: Hier wird die tatsächliche Nutzung abgerechnet, wobei als Abrechnungseinheit das “Token” verwendet wird. Ein Token entspricht je nach Sprache ca. 0.65 bis 0.75 Worten. Typische Tarifoptionen für aktuelle KI-Modelle liegen bei ca. 0.02 € für 1.000 Tokens. Einige Hersteller unterscheiden Kosten für durch Nutzende gesendete Tokens und vom KI-Modell generierte Tokens. Trotzdem sind 0.02 € / 1.000 Tokens eine gute Näherung für die meisten KI-Anbieter. Sprich: 650 bis 750 Worte kosten ca. 2 ct.


Erfahrungen

In Ermangelung bezahlbarer “Flatrates” bevorzugen die meisten Hochschulen derzeit eine Token-basierte Abrechnung. Wesentlicher Grund dafür ist, dass sich anfängliche Sorgen aufgrund potenziell ausufernder Token-Volumina nicht bestätigt haben.

Erste Erfahrungen an großen nordrhein-westfälischen Hochschulen wie etwa der RWTH Aachen und auch in anderen Bundesländern legen die Schätzung nahe, dass durchschnittlich zwischen 5 - 20 ct. pro Monat und User auszugehen ist. Eine Hochschule mit 10.000 Nutzenden kann demnach mit etwa 500,- bis 2.000,- € Kosten für das hochschulweite Angebot eines kommerziellen generativen KI-Dienstes rechnen.

Diese moderaten Kosten überraschen zunächst, sind aber durch einen genaueren Blick auf die Nutzungsdaten gut erklärbar. Nach einer anfänglichen Erprobungsphase, in der viele Nutzende den KI-Dienst mit wenigen Prompts ausprobieren, kristallisiert sich bei nahezu allen befragten Hochschulen eine deutlich kleinere Gruppe von “Power-Usern” heraus, die individuell hohe Token-Volumina generieren. Die überwiegende Mehrheit der Hochschulangehörigen jedoch nutzt den KI-Dienst nur sporadisch oder gar nicht.


Fallstudie: RWTH Aachen University

Die RWTH Aachen bietet seit dem 16. Juli 2024 eine ChatGPT-Instanz für die Beschäftigten zur kostenfreien Nutzung an. Genutzt werden kann unter anderem das KI-Modell GPT-4o mit Kosten von ca. 0.021 € / 1.000 Tokens. Der Roll-Out wurde gestaffelt durchgeführt, so dass über einen Zeitraum von ca. zwei Wochen nach und nach etwa 10.000 Personen an der RWTH für die Nutzung freigeschaltet worden sind. Seit dem 29.07.2024 können alle Beschäftigten den KI-Dienst nutzen. Die an der RWTH programmierte Weboberfläche Connect:UI erlaubt den Upload von z.B. PDF-Dokumenten, so dass potenziell in kurzer Zeit hohe Mengen an Tokens zur Verarbeitung an den KI-Dienst geschickt werden können.

Über den Zeitraum der ersten 30 Tage nach Freischalten wurden bis zum 15.08.2024 insgesamt knapp 450,- € Token-Volumen generiert. Unter Berücksichtigung des gestaffelten Roll-Outs ergeben sich knapp 5 ct pro User und Tag als zutreffende Schätzung, die am unteren Rand der oben skizzierten Bandbreite liegt. Aktuell nutzen ca. 250 tägliche User den Dienst und generieren gemeinsam etwa 15,- € Kosten pro Tag.

Die Zahl der täglich aktiven User ist dabei weitgehend stabil, es kommen also nicht systematisch weitere regelmäßige Nutzende hinzu. Auch das Tokenvolumen pro Tag hat keinen eindeutig ansteigenden Trend. Wir gehen daher nicht davon aus, dass sich die Nutzungszahlen und entsprechend auch die Kosten in der näheren Zukunft abrupt erhöhen werden. Entsprechend stehen auch dem Anschluss der Studierendenschaft keine grundsätzlichen Bedenken gegenüber.

Hier liefern die Erfahrungen anderer Hochschulen hilfreiche Zusatzinformationen. Auch dort wurde beobachtet, dass die Nutzung von hochschuleigenen KI-Diensten durch Beschäftigte wenigstens in der Anfangszeit deutlich schwächer ausgefallen ist als erwartet. Bei Studierenden zeigt sich ein anderes Bild. Hier scheint die Nutzungsintensität deutlich höher zu sein als bei den Beschäftigten. Für Studierende an anderen Hochschulstandorten liegen die Kosten pro Person und Monat eher am oberen Bereich der oben taxierten Bandbreite bewegen, also ca 15 - 20 ct pro Prson und Tag.

Die Gesamtkosten für die entstehenden Token-Volumina an einer typischen Hochschule sind damit zum aktuellen Zeitpunkt als Mischkalkulation zu verstehen. Eine moderaten Nutzungsintensität auf Seiten der Beschäftigen wird durch ein deutlich höheres Nutzungsaufkommen bei den Studierenden ergänzt.

Mittelfristig dürfte sich weiterer Anstieg der Nutzungsintensität ergeben, wenn die Mitglieder der Hochschule vertrauter im Umgang mit KI-Diensten werden, zudem die aktuell vermutlich noch privat beschafften Bezahlaccounts zugunsten des Hochschulangebots aufgegeben werden und auch die Studierenden angeschlossen sind. Auch hier muss aber keine plötzliche Explosion der Kosten befürchtet werden.


Zusammenfassung und Empfehlung

Die Kosten für den Betrieb kommerzieller KI-Dienste auf hochschulweiter Ebene sind nach aktuellem Stand handhabbar. Abrupte Anstiege der Kosten sind nicht zu erwarten.

Trotzdem empfehlen wir den Hochschulen, umfassende Maßnahmen zur Kontrolle der Kosten einzführen, wie sie z.B. durch Connect:UI ermöglicht werden. Dazu gehören:

  1. Begrenzung des Promptaufkommens
    • Festlegung von rollierenden Limits für die Anzahl der Prompts pro User in einem definierten Zeitraum, z.B. “100 Prompts in den letzten drei 3 Stunden”.
    • Festlegung absoluter Limits für die Anzahl der Prompts pro User in einem vorgegebenen Zeitintervall, z.B. “500 Prompts pro Woche”
    • Feingranulare Aufteilung entsprechend der tatsächlichen Kosten für die jeweiligen Modelle, z.B. “100 Prompts für GPT-4o und 250 Prompts für GPT-3.5”.
    • Setzung verschiedener Limits für verschiedene Usergruppen, z.B. für regulär Beschäftigte und assoziierte Personengruppen.
    • Festlegung fester Obergrenzen von Tokens pro Tag, Woche oder Monat.
    • Festlegung harter Kostenlimits, deren Überschreiten automatisch festgestellt wird und zu einer sofortigen Abschaltung des KI-Dienstes führt.
  2. Ermöglichung einer Kostenzurechnung
    • Berücksichtigung von Kostenstellen, so dass auch bei erschöpftem “Freivolumen” die Möglichkeit haben, die Dienste zulasten eigener Kostenstellen weiterhin zu nutzen.
  3. Bewusstsein schaffen
    • Anzeige der getätigten Prompts, um das Prompt-Aufkommen für Nutzende transparent zu machen.
    • Anzeige des Tokenverbrauchs oder des ökologischen Fußabdrucks, um die Awareness bei den Nutzenden zu erhöhen.
    • Fort- und Weiterbildung der Nutzenden zu einem verantwortungsvollen Umgang mit den KI-Diensten.