귀하의 속도 제한은 사용 등급에 따라 달라지며, 현재 세 가지 주요 지표로 측정됩니다:
분당 요청 수 (RPM)
분당 입력 토큰 수 (ITPM)
분당 출력 토큰 수 (OTPM)
이러한 속도 제한 중 하나라도 초과하면, 어떤 속도 제한이 초과되었는지 설명하는 429 오류와 함께 대기 시간을 나타내는 retry-after
헤더를 받게 됩니다.
속도 제한은 조직 수준에서 설정되며 사용 등급에 의해 정의됩니다. 각 등급은 서로 다른 지출 및 속도 제한을 가지며, 사용량 임계값에 따라 Tier 4까지 자동으로 등급이 상승합니다.
귀하의 조직의 현재 등급과 제한을 Anthropic Console에서 확인할 수 있습니다.
사용 등급과 속도 제한에 대한 자세한 정보는 저희 API 문서에서 확인할 수 있습니다.