レート制限は使用ティアによって決まり、現在は3つの主要な指標で測定されています:
1分あたりのリクエスト数(RPM)
1分あたりの入力トークン数(ITPM)
1分あたりの出力トークン数(OTPM)
これらのレート制限のいずれかを超えた場合、どのレート制限が超過されたかを説明する429エラーと、待機時間を示すretry-after
ヘッダーが返されます。
レート制限は組織レベルで設定され、使用ティアによって定義されます。各ティアには異なる支出とレート制限があり、ティア4まで使用量の閾値に基づいて自動的にティアが昇格します。
組織の現在のティアと制限はAnthropicコンソールで確認できます。
使用ティアとレート制限の詳細については、APIドキュメントをご覧ください。