
Warum wachsen KI-Kosten im Betrieb schneller als erwartet?
Wer KI-Automatisierung zum ersten Mal einsetzt, denkt oft in Projektkosten: Was kostet die Einrichtung? Wie lange dauert die Implementierung? Was kostet die Lizenz?
Die eigentliche Kostenfrage kommt danach. Im laufenden Betrieb entstehen Kosten pro Anfrage, pro verarbeitetem Dokument, pro generierter Antwort. Bei Sprachmodellen (LLMs) werden diese Kosten in sogenannten Tokens abgerechnet. Ein Token entspricht ungefähr einem Wort oder einem Wortteil. Jede Anfrage an das Modell verbraucht Tokens, jede Antwort ebenso.
Das klingt nach Centbeträgen. Und einzeln betrachtet ist es das auch. Aber wenn ein automatisierter Prozess täglich 500 Dokumente verarbeitet, 200 E-Mails klassifiziert oder 100 Angebote erstellt, summieren sich die Token-Kosten. Wir erleben es immer wieder, dass Unternehmen im Proof of Concept begeistert sind, aber nach drei Monaten Betrieb überrascht auf die Rechnung schauen.
Der Grund ist fast immer derselbe: Für jede Aufgabe wird das leistungsstärkste (und teuerste) Modell eingesetzt. Eine einfache E-Mail-Klassifizierung wird mit dem gleichen Modell durchgeführt wie eine komplexe Vertragsanalyse. Das ist so, als würde ein Steuerberater jede einzelne Eingangsrechnung persönlich prüfen.
Was bedeutet das für den Mittelstand?
Viele mittelständische Unternehmen stehen gerade vor der Entscheidung: KI-Automatisierung einführen oder abwarten? Eine der häufigsten Bedenken, die wir in Erstgesprächen hören: „Was kostet das im Betrieb? Und wie skaliert das?“
Die Advisor-Strategie gibt darauf eine konkrete Antwort. KI-Kosten sind keine Fixgröße. Sie hängen von der Architektur ab. Ein Unternehmen, das 500 eingehende E-Mails pro Tag automatisiert klassifiziert, kann mit der richtigen Modellkombination bei Kosten von wenigen Euro pro Tag landen. Das gleiche Volumen mit dem teuersten Modell für jede einzelne Anfrage kostet ein Vielfaches.
Für uns bei arcnode ist das Prinzip nicht neu. Wir setzen seit unserer Gründung auf die Kombination verschiedener Modelle, je nach Aufgabe und Komplexität. Die Advisor-Strategie gibt dem einen offiziellen Namen und eine saubere technische Umsetzung.
Unser Ansatz: In jedem Projekt analysieren wir zuerst, welche Teilaufgaben welches Komplexitätsniveau haben. Dann wählen wir die Modellkombination, die das beste Verhältnis aus Kosten und Qualität liefert. Das ist keine Frage der Technik, das ist eine unternehmerische Entscheidung.
Die Aufteilung ist nie starr. Sie hängt vom Prozess ab, vom Volumen, von der Fehlertoleranz und von den konkreten Anforderungen.
In einem Erstgespräch lässt sich in der Regel innerhalb von 30 Minuten einschätzen, welche Kombination für einen bestimmten Prozess sinnvoll ist.

Häufige Fragen zu KI-Kosten
Was kostet KI-Automatisierung im laufenden Betrieb?
Das hängt vom Modell, dem Volumen und der Architektur ab. Als grobe Orientierung: Ein automatisierter Prozess, der 200 Dokumente pro Tag verarbeitet, kann je nach Modellwahl zwischen 3 und 50 Euro pro Tag kosten. Die Spanne zeigt, warum die Modellarchitektur so wichtig ist.
Was sind Tokens und warum sind sie für die Kosten relevant?
Tokens sind die Abrechnungseinheit von Sprachmodellen. Ein Token entspricht ungefähr einem Wort oder Wortteil in deutscher Sprache. Jede Anfrage an ein Modell verbraucht Eingabe-Tokens (die Frage) und Ausgabe-Tokens (die Antwort). Je länger und komplexer die Anfrage, desto mehr Tokens werden verbraucht. Bei leistungsstarken Modellen kosten Tokens mehr als bei einfacheren Modellen.
Kann man KI-Kosten vorab kalkulieren?
Ja, das ist Teil jedes seriösen Projekts. In der Analysephase wird das erwartete Volumen geschätzt, die Modellkombination festgelegt und daraus eine monatliche Betriebskostenprognose erstellt. Bei arcnode ist diese Kalkulation Bestandteil jedes Angebots, damit es keine Überraschungen gibt.
Muss mein IT-Team die Advisor-Strategie selbst umsetzen?
Nein. Die Modellarchitektur wird im Rahmen der Implementierung festgelegt und konfiguriert. Im laufenden Betrieb läuft das System automatisch. Die Entscheidung, wann der Advisor eingeschaltet wird, trifft das System auf Basis definierter Regeln und Schwellenwerte.
Was ist die Advisor-Strategie bei KI-Automatisierung?
Die Advisor-Strategie ist ein von Anthropic entwickeltes Architekturprinzip: Ein günstiges KI-Modell (Executor) übernimmt Routineaufgaben wie Dokumentenklassifizierung oder Datenextraktion. Ein leistungsstarkes Modell (Advisor) wird nur bei komplexen Ausnahmen hinzugezogen. In Benchmarks reduziert das die Kosten pro Aufgabe um bis zu 85 % bei gleichzeitig höherer Qualität.
Wann lohnt sich Claude Sonnet und wann Claude Opus?
Claude Sonnet eignet sich für wiederkehrende Aufgaben mit klaren Regeln:
Dokumentenklassifizierung, Datenextraktion, Standard-E-Mails, Zusammenfassungen.
Claude Opus lohnt sich bei Sonderfällen mit mehrdeutigen Informationen, bei Entscheidungen
mit mehreren Kontextquellen und bei Qualitätsprüfungen kritischer Prozesse.
Die Kombination beider Modelle (Advisor-Strategie) liefert die besten Ergebnisse
zum niedrigsten Preis.
Quellen
- Anthropic: „The advisor strategy: Give agents an intelligence boost.“ Claude Blog, April 2026.
- Benchmark-Daten: SWE-bench Multilingual, BrowseComp, Terminal-Bench 2.0 (veröffentlicht in der Anthropic-Studie).
- Google Developers: Dokumentation zu AI API Pricing (Stand April 2026).
