Claude Sonnet vs. Opus: Wie die Advisor-Strategie KI-Kosten um 85 % senkt

Die Advisor-Strategie ist ein von Anthropic veröffentlichtes Architekturprinzip für KI-Automatisierung: Ein günstiges Sprachmodell übernimmt die Routinearbeit, ein leistungsstarkes Modell wird nur bei komplexen Ausnahmen hinzugezogen. In Benchmarks senkt das die KI-Kosten um bis zu 85 %. Die meisten Unternehmen, die KI-Automatisierung einsetzen, machen am Anfang denselben Fehler: Sie lassen das leistungsstärkste Modell jede Aufgabe erledigen. Das funktioniert, ist aber wie ein Geschäftsführer, der persönlich jede Bestellung prüft. Teuer, langsam, unnötig. Dieser Artikel zeigt, wie sich KI-Kosten im laufenden Betrieb senken lassen, ohne die Ergebnisqualität zu verlieren.

Das Wichtigste in Kürze

Die Betriebskosten von KI-Automatisierung hängen weniger von der Technologie ab als von der Architektur. Welches Modell welche Aufgabe übernimmt, bestimmt die Kosten.
Anthropic (Hersteller von Claude) hat mit der sogenanntenAdvisor-Strategie ein Prinzip veröffentlicht, das viele Unternehmen sofort anwenden können: Ein günstiges Modell erledigt die Routinearbeit, ein leistungsstarkes Modell wird nur bei komplexen Entscheidungen hinzugezogen.
In Benchmarks reduziert dieses Prinzip die Kosten pro Aufgabe um bis zu 85 % bei gleichzeitig höherer Ergebnisqualität als mit dem günstigen Modell allein.
Für den Mittelstand bedeutet das: KI-Automatisierung muss nicht teuer sein, wenn die Architektur stimmt. Die Technik ist da. Die Frage ist, ob sie richtig eingesetzt wird.
Diagramm zur Advisor-Strategie mit Executor- und Advisor-Modell

Warum wachsen KI-Kosten im Betrieb schneller als erwartet?

Wer KI-Automatisierung zum ersten Mal einsetzt, denkt oft in Projektkosten: Was kostet die Einrichtung? Wie lange dauert die Implementierung? Was kostet die Lizenz?

Die eigentliche Kostenfrage kommt danach. Im laufenden Betrieb entstehen Kosten pro Anfrage, pro verarbeitetem Dokument, pro generierter Antwort. Bei Sprachmodellen (LLMs) werden diese Kosten in sogenannten Tokens abgerechnet. Ein Token entspricht ungefähr einem Wort oder einem Wortteil. Jede Anfrage an das Modell verbraucht Tokens, jede Antwort ebenso.

Das klingt nach Centbeträgen. Und einzeln betrachtet ist es das auch. Aber wenn ein automatisierter Prozess täglich 500 Dokumente verarbeitet, 200 E-Mails klassifiziert oder 100 Angebote erstellt, summieren sich die Token-Kosten. Wir erleben es immer wieder, dass Unternehmen im Proof of Concept begeistert sind, aber nach drei Monaten Betrieb überrascht auf die Rechnung schauen.

Der Grund ist fast immer derselbe: Für jede Aufgabe wird das leistungsstärkste (und teuerste) Modell eingesetzt. Eine einfache E-Mail-Klassifizierung wird mit dem gleichen Modell durchgeführt wie eine komplexe Vertragsanalyse. Das ist so, als würde ein Steuerberater jede einzelne Eingangsrechnung persönlich prüfen.

Was ist die Advisor-Strategie?

Anthropic, der Hersteller von Claude, hat im April 2026 ein Konzept veröffentlicht, das dieses Problem elegant löst: die Advisor-Strategie.

Die Idee: Ein kostengünstiges Modell (der „Executor“) erledigt die tägliche Arbeit. Es verarbeitet Dokumente, beantwortet Anfragen, führt Routineaufgaben aus. Wenn es auf eine Aufgabe stößt, die es nicht sicher lösen kann, fragt es ein leistungsstärkeres Modell (den „Advisor“) um Rat. Der Advisor liefert eine Einschätzung, eine Korrektur oder eine Empfehlung und der Executor arbeitet weiter.

Das Prinzip kennt jeder aus dem Arbeitsalltag: Ein Sachbearbeiter bearbeitet 95 % der Fälle selbstständig. Bei den restlichen 5 % holt er sich eine Freigabe oder Einschätzung von der Teamleitung. Niemand würde auf die Idee kommen, die Teamleitung jeden einzelnen Vorgang bearbeiten zu lassen.
Übertragen auf KI-Modelle heißt das: Ein Modell wie Claude Sonnet (schnell, günstig, für die meisten Aufgaben ausreichend) arbeitet als Executor. Claude Opus (langsamer, teurer, höchste Qualität) kommt nur dann zum Einsatz, wenn es wirklich nötig ist. Das Ergebnis: Die Kosten sinken, die Qualität bleibt.

Wie funktioniert das in der Praxis?

01

Ohne Advisor-Strategie:

Jede eingehende Bestellung wird vom leistungsstärksten Modell verarbeitet. Egal ob es eine Standardbestellung über 3 Positionen ist oder eine Sonderanfrage mit abweichenden Lieferbedingungen und Rahmenvertragsreferenz. Jede Anfrage kostet gleich viel.

02

Mit Advisor-Strategie:

Das günstige Modell (Executor) verarbeitet Standardbestellungen selbstständig. Positionen extrahieren, Kundennummer zuordnen, Bestellbestätigung vorbereiten. Bei Sonderfällen (unbekannter Kunde, abweichende Konditionen, unklare Artikelbezeichnung) fragt es den Advisor. Der Advisor prüft den Kontext und gibt eine Empfehlung. Der Executor setzt sie um.

03

Das Ergebnis

90 % der Bestellungen werden zum Bruchteil der bisherigen Kosten verarbeitet. Die restlichen 10 % erhalten die volle Prüftiefe. Die Gesamtkosten sinken, die Qualität steigt sogar, weil der Advisor gezielt dort eingesetzt wird, wo es drauf ankommt.

Zahlen

Was bringt die Advisor-Strategie wirklich?

Anthropic hat die Advisor-Strategie in mehreren Benchmarks getestet. Die Ergebnisse sind bemerkenswert:

Claude Sonnet mit Opus als Advisor

erzielte auf dem SWE-bench Multilingual (einem Benchmark für Softwareentwicklung) 2,7 Prozentpunkte mehr als Sonnet allein, bei 11,9 % geringeren Kosten pro Aufgabe. Mehr Qualität, weniger Kosten.

Claude Haiku mit Opus als Advisor

erzielte auf dem BrowseComp-Benchmark (einem Test für Webrecherche) eine Punktzahl von 41,2 %. Haiku allein kam auf 19,7 %. Die Qualität hat sich also verdoppelt. Gleichzeitig kostete die Kombination 85 % weniger als Sonnet allein.

Das sind Laborwerte, keine Produktionsdaten.

Aber sie zeigen das Prinzip: Wenn das richtige Modell zur richtigen Zeit eingesetzt wird, sinken Kosten und Qualität steigt gleichzeitig.

Quellen: Anthropic, „The advisor strategy: Give agents an intelligence boost“, April 2026. Benchmark-Daten: SWE-bench Multilingual, BrowseComp, Terminal-Bench 2.0.

Was bedeutet das für den Mittelstand?

Viele mittelständische Unternehmen stehen gerade vor der Entscheidung: KI-Automatisierung einführen oder abwarten? Eine der häufigsten Bedenken, die wir in Erstgesprächen hören: „Was kostet das im Betrieb? Und wie skaliert das?“

Die Advisor-Strategie gibt darauf eine konkrete Antwort. KI-Kosten sind keine Fixgröße. Sie hängen von der Architektur ab. Ein Unternehmen, das 500 eingehende E-Mails pro Tag automatisiert klassifiziert, kann mit der richtigen Modellkombination bei Kosten von wenigen Euro pro Tag landen. Das gleiche Volumen mit dem teuersten Modell für jede einzelne Anfrage kostet ein Vielfaches.

Für uns bei arcnode ist das Prinzip nicht neu. Wir setzen seit unserer Gründung auf die Kombination verschiedener Modelle, je nach Aufgabe und Komplexität. Die Advisor-Strategie gibt dem einen offiziellen Namen und eine saubere technische Umsetzung.

Unser Ansatz: In jedem Projekt analysieren wir zuerst, welche Teilaufgaben welches Komplexitätsniveau haben. Dann wählen wir die Modellkombination, die das beste Verhältnis aus Kosten und Qualität liefert. Das ist keine Frage der Technik, das ist eine unternehmerische Entscheidung.

Welche Aufgaben eignen sich für welches Modell?

Eine grobe Orientierung aus unserer Projekterfahrung:

Günstige Modelle (Executor)

eignen sich für:

Dokumentenklassifizierung (z. B. Rechnungen, Bestellungen, Anfragen)
Datenextraktion aus strukturierten Vorlagen
Standardisierte E-Mail-Antworten
Zusammenfassungen von Texten nach festen Regeln
Routineprüfungen mit klaren Kriterien

Leistungsstarke Modelle (Advisor)

eignen sich für:

Sonderfälle mit mehrdeutigen oder unvollständigen Informationen
Entscheidungen, die Kontext aus mehreren Quellen erfordern
Qualitätsprüfungen bei kritischen Prozessen
Situationen, in denen ein Fehler teuer wäre

Die Aufteilung ist nie starr. Sie hängt vom Prozess ab, vom Volumen, von der Fehlertoleranz und von den konkreten Anforderungen.
In einem Erstgespräch lässt sich in der Regel innerhalb von 30 Minuten einschätzen, welche Kombination für einen bestimmten Prozess sinnvoll ist.

Kostenvergleich verschiedener LLM-Modellkombinationen im Unternehmenseinsatz

Drei Fragen, die Unternehmen vor dem Start klären sollten

1. Welche Aufgaben im Prozess sind Routine, welche sind Ausnahme?

Je klarer diese Trennung ist, desto gezielter kann die Modellkombination gewählt werden. Ein Prozess mit 95 % Standardfällen profitiert enorm von der Advisor-Strategie. Ein Prozess, bei dem jeder Fall individuell ist, weniger.

2. Wie teuer ist ein Fehler?

Bei einer E-Mail-Klassifizierung kostet ein Fehler eine manuelle Korrektur. Bei einer Vertragsanalyse kann ein Fehler rechtliche Konsequenzen haben. Die Fehlertoleranz bestimmt, wie großzügig der Executor arbeiten darf und wie schnell der Advisor eingeschaltet wird.

3. Wie viele Anfragen fallen pro Tag an?

Die Advisor-Strategie lohnt sich besonders bei hohem Volumen. Bei 10 Anfragen pro Tag ist die Ersparnis minimal. Bei 500 oder mehr summiert sich der Unterschied auf mehrere hundert Euro pro Monat. Das klingt vielleicht nicht nach viel, aber über 12 Monate und über mehrere Prozesse hinweg wird es ein relevanter Posten.

Häufige Fragen zu KI-Kosten

Was kostet KI-Automatisierung im laufenden Betrieb?

Das hängt vom Modell, dem Volumen und der Architektur ab. Als grobe Orientierung: Ein automatisierter Prozess, der 200 Dokumente pro Tag verarbeitet, kann je nach Modellwahl zwischen 3 und 50 Euro pro Tag kosten. Die Spanne zeigt, warum die Modellarchitektur so wichtig ist.

Was sind Tokens und warum sind sie für die Kosten relevant?

Tokens sind die Abrechnungseinheit von Sprachmodellen. Ein Token entspricht ungefähr einem Wort oder Wortteil in deutscher Sprache. Jede Anfrage an ein Modell verbraucht Eingabe-Tokens (die Frage) und Ausgabe-Tokens (die Antwort). Je länger und komplexer die Anfrage, desto mehr Tokens werden verbraucht. Bei leistungsstarken Modellen kosten Tokens mehr als bei einfacheren Modellen.

Kann man KI-Kosten vorab kalkulieren?

Ja, das ist Teil jedes seriösen Projekts. In der Analysephase wird das erwartete Volumen geschätzt, die Modellkombination festgelegt und daraus eine monatliche Betriebskostenprognose erstellt. Bei arcnode ist diese Kalkulation Bestandteil jedes Angebots, damit es keine Überraschungen gibt.

Muss mein IT-Team die Advisor-Strategie selbst umsetzen?

Nein. Die Modellarchitektur wird im Rahmen der Implementierung festgelegt und konfiguriert. Im laufenden Betrieb läuft das System automatisch. Die Entscheidung, wann der Advisor eingeschaltet wird, trifft das System auf Basis definierter Regeln und Schwellenwerte.

Was ist die Advisor-Strategie bei KI-Automatisierung?

Die Advisor-Strategie ist ein von Anthropic entwickeltes Architekturprinzip: Ein günstiges KI-Modell (Executor) übernimmt Routineaufgaben wie Dokumentenklassifizierung oder Datenextraktion. Ein leistungsstarkes Modell (Advisor) wird nur bei komplexen Ausnahmen hinzugezogen. In Benchmarks reduziert das die Kosten pro Aufgabe um bis zu 85 % bei gleichzeitig höherer Qualität.

Wann lohnt sich Claude Sonnet und wann Claude Opus?

Claude Sonnet eignet sich für wiederkehrende Aufgaben mit klaren Regeln:
Dokumentenklassifizierung, Datenextraktion, Standard-E-Mails, Zusammenfassungen.
Claude Opus lohnt sich bei Sonderfällen mit mehrdeutigen Informationen, bei Entscheidungen
mit mehreren Kontextquellen und bei Qualitätsprüfungen kritischer Prozesse.
Die Kombination beider Modelle (Advisor-Strategie) liefert die besten Ergebnisse
zum niedrigsten Preis.

Quellen

Nach oben scrollen