Chris EichlerAI-first Product
& Marketing

Claude Code: Effort & Adaptive Thinking


1) /effort max — Maximales Reasoning-Budget

Was ist das?

/effort ist ein Slash-Command in Claude Code, mit dem du steuerst, wie viel Rechen-Aufwand ("Thinking Budget") Claude in eine Antwort steckt. Es gibt fünf Stufen:

LevelSymbolVerhalten
lowSchnell, oberflächlich. Gut für triviale Tasks (Rename, kleine Edits).
mediumDefault. Solider Allrounder.
highTieferes Reasoning, mehr Edge Cases.
xhighZwischenstufe (eingeführt mit Opus 4.7).
maxKein Token-Limit. Maximales Nachdenken.

Wie aktivieren?

Im Terminal innerhalb einer Claude Code Session einfach tippen:

/effort max

Das gilt für die aktuelle Session. Beim Neustart fällt Claude wieder auf den Default (medium) zurück — außer du setzt es permanent über die Env-Variable:

export CLAUDE_CODE_EFFORT_LEVEL=max

(z.B. in ~/.zshrc oder ~/.bashrc)

Auswirkungen

Was du gewinnst:

  • Claude sucht aktiv nach Edge Cases, die du nicht erwähnt hast.
  • Findet Bugs, die du selbst noch nicht gesehen hast.
  • Berücksichtigt Architektur, Performance und Security gleichzeitig.
  • Plant mehrstufige Refactorings sauber durch, statt naiv loszulegen.
  • Bei komplexem Debugging: liefert 2–3x bessere Hypothesen.

Was es kostet:

  • Mehr Wartezeit (bei großen Tasks deutlich — teilweise 30–60 s vor der ersten Antwort).
  • Mehr Token-Verbrauch (relevant bei Pay-per-Token, weniger bei Max-Plan).
  • Overkill für Trivia: „Rename diese Variable" braucht kein max.

Wann benutzen?

Ja zu /effort max:

  • Architektur-Entscheidungen, ADRs
  • Komplexes Debugging (Race Conditions, Memory Leaks)
  • Refactorings über mehrere Files
  • Code Review von kritischen PRs
  • Security-Reviews

Nein zu /effort max:

  • Variablen umbenennen
  • Kleine UI-Tweaks
  • Boilerplate-Code (Forms, CRUD)
  • One-Liner-Skripte

2) CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 — Adaptives Denken abschalten

Was ist Adaptive Thinking?

Adaptive Thinking ist ein Feature in Opus 4.6 / Sonnet 4.6+, bei dem das Modell selbst entscheidet, wie viele Reasoning-Tokens es pro Turn investiert. Idee: bei einfachen Antworten weniger denken, bei komplexen mehr.

Das Problem: Manchmal entscheidet das Modell, null Reasoning-Tokens zu nutzen — auch bei Tasks, bei denen es eigentlich nachdenken müsste. Das Ergebnis: präzise Halluzinationen:

  • Erfundene Commit-SHAs, die plausibel aussehen.
  • Nicht-existierende apt-Pakete.
  • API-Versionen, die es nie gab.
  • Funktionsnamen, die nirgends im Code stehen.

Wie aktivieren?

Vor dem Start von Claude Code in der Shell setzen:

export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

Oder dauerhaft in ~/.zshrc / ~/.bashrc eintragen. Wichtig: Environment-Variablen werden nur beim Start von Claude Code gelesen — also nach dem Setzen einmal neu starten.

Auswirkungen

Was passiert:

  • Claude nutzt ein fixes Reasoning-Budget pro Turn (gesteuert über MAX_THINKING_TOKENS), statt selbst zu entscheiden.
  • Jede Antwort bekommt garantiert Thinking-Tokens — keine „Faulheit" mehr.
  • Massiv reduzierte Halluzinations-Rate, besonders bei Code-Generierung mit konkreten Library-/Framework-Namen.

Was es kostet:

  • Mehr Token-Verbrauch insgesamt (auch triviale Antworten kriegen jetzt Thinking).
  • Etwas längere Antwortzeiten bei einfachen Tasks.

Was steuert das Budget dann?

Sobald Adaptive Thinking aus ist, gilt entweder die MAX_THINKING_TOKENS-Variable oder das Effort-Level (/effort max etc.). Mit beidem zusammen kannst du also präzise konfigurieren:

export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1
export CLAUDE_CODE_EFFORT_LEVEL=max

→ Maximaler, fixer Reasoning-Aufwand bei jeder Antwort. Das ist die „Pro-Modus"-Konfiguration für ernsthafte Engineering-Arbeit.

Inspiration zu KI-first Product Management & Marketing, direkt in dein Postfach.

Kein Spam, jederzeit abbestellbar

Chris Eichler