Question 1

Wie genau ist die Token-Zählung?

Accepted Answer

Die Schätzung liegt für englischen Text typischerweise innerhalb von 10–20 % des tatsächlichen Wertes. Sie verwendet ein Zeichen-zu-Token-Verhältnis (Standard 4,0 für Englisch), was eine etablierte Näherung ist. Für exakte Zählungen verwenden Sie den offiziellen Tokenizer des jeweiligen Anbieters. Dieses Tool ist für schnelle Planung konzipiert, nicht für präzise Abrechnungsberechnungen.

Question 2

Was ist der Unterschied zwischen Kontextfenster und maximaler Ausgabe?

Accepted Answer

Das Kontextfenster ist das Gesamtlimit für Eingabe + Ausgabe kombiniert. Die maximale Ausgabe ist die maximale Anzahl von Tokens, die das Modell in seiner Antwort generiert. Zum Beispiel hat Claude Opus 4.6 ein 200K-Kontextfenster, aber eine maximale Ausgabe von 32K. Ihr Prompt kann bis zu 168K Tokens verwenden, wobei Platz für die Antwort bleibt.

Question 3

Warum verbraucht mein Text bei jedem Modell einen anderen Prozentsatz?

Accepted Answer

Weil jedes Modell eine unterschiedliche Gesamtgröße des Kontextfensters hat. Derselbe Text, der 0,2 % von Geminis 1M-Kontext beansprucht, könnte 1,5 % eines 65K-Kontextmodells ausmachen. Genau deshalb ist die Vergleichsansicht nützlich — sie zeigt Ihnen, welche Modelle Ihren Inhalt problemlos verarbeiten können.

Question 4

Sollte ich den Verhältnis-Regler anpassen?

Accepted Answer

Für den meisten englischen Text funktioniert der Standardwert von 4,0 gut. Wenn Ihr Inhalt hauptsächlich aus Code besteht, probieren Sie 3,5. Für chinesischen, japanischen oder koreanischen Text verwenden Sie 2,5. Für gemischte Inhalte belassen Sie den Wert bei 4,0 — die Fehlermarge ist für Planungszwecke akzeptabel.

Question 5

Was passiert, wenn der Text das Kontextfenster eines Modells überschreitet?

Accepted Answer

Die API des Modells gibt entweder einen Fehler zurück oder schneidet Ihre Eingabe stillschweigend ab, je nach Anbieter. OpenAI gibt eine klare Fehlermeldung zurück. Einige Anbieter kürzen automatisch ab dem Beginn der Konversation. Es ist am besten, unter 80 % Auslastung zu bleiben, um Platz für die Antwort des Modells zu lassen.

Kontextfenster-Visualisierer & Token-Zähler

Was ist ein Kontextfenster-Visualisierer?

So verwenden Sie dieses Tool

Token-Schätzung verstehen

Warum nur eine Annäherung?

Sprachunterschiede

Kontextfenster-Vergleich nach Anbieter

Häufig gestellte Fragen

Verwandte Werkzeuge

Verwandte Werkzeuge

KI-API-Kostenrechner

LLM-Parameter-Spielwiese

Fine-Tuning-Dataset-Validator