メインコンテンツにスキップ

APIレート制限に対する私たちのアプローチ

今週アップデートされました

レート制限は使用ティアによって決まり、現在は3つの主要な指標で測定されています:

  1. 1分あたりのリクエスト数(RPM)

  2. 1分あたりの入力トークン数(ITPM)

  3. 1分あたりの出力トークン数(OTPM)

これらのレート制限のいずれかを超えた場合、どのレート制限が超過されたかを説明する429エラーと、待機時間を示すretry-afterヘッダーが返されます。

レート制限は組織レベルで設定され、使用ティアによって定義されます。各ティアには異なる支出とレート制限があり、ティア4まで使用量の閾値に基づいて自動的にティアが昇格します。

組織の現在のティアと制限はAnthropicコンソールで確認できます。

使用ティアとレート制限の詳細については、APIドキュメントをご覧ください。

こちらの回答で解決しましたか?