Ваш лимит скорости зависит от вашего уровня использования и в настоящее время измеряется тремя ключевыми метриками:
Запросы в минуту (RPM)
Входящие токены в минуту (ITPM)
Исходящие токены в минуту (OTPM)
Если вы превысите любой из этих лимитов скорости, вы получите ошибку 429, описывающую, какой лимит скорости был превышен, вместе с заголовком retry-after
, указывающим, как долго нужно ждать.
Лимиты скорости устанавливаются на уровне организации и определяются уровнями использования. Каждый уровень имеет различные лимиты расходов и скорости, с автоматическим продвижением по уровням на основе пороговых значений использования до Уровня 4.
Вы можете просмотреть текущий уровень и лимиты вашей организации в Anthropic Console.
Более подробную информацию об уровнях использования и лимитах скорости можно найти в нашей документации API.