Ihr Ratenlimit hängt von Ihrer Nutzungsstufe ab und wird derzeit in drei wichtigen Metriken gemessen:
Anfragen pro Minute (RPM)
Eingabe-Token pro Minute (ITPM)
Ausgabe-Token pro Minute (OTPM)
Wenn Sie eines dieser Ratenlimits überschreiten, erhalten Sie einen 429-Fehler, der beschreibt, welches Ratenlimit überschritten wurde, zusammen mit einem retry-after
-Header, der angibt, wie lange Sie warten müssen.
Ratenlimits werden auf Organisationsebene festgelegt und durch Nutzungsstufen definiert. Jede Stufe hat unterschiedliche Ausgaben- und Ratenlimits, mit automatischem Stufenaufstieg basierend auf Nutzungsschwellenwerten bis zu Stufe 4.
Sie können die aktuelle Stufe und Limits Ihrer Organisation in der Anthropic Console einsehen.
Weitere Informationen zu Nutzungsstufen und Ratenlimits finden Sie in unserer API-Dokumentation.