메인 콘텐츠로 건너뛰기
이 페이지에서는 Serverless Inference에 적용되는 가격, 사용 제한, 계정 제한 사항을 설명합니다. 이 정보를 바탕으로 사용을 계획하고 예상치 못한 요금이나 서비스 중단을 방지하세요. 특히 청구를 관리하거나 더 높은 동시성으로 프로덕션 트래픽을 운영하는 경우에는 프로덕션 트래픽을 보내기 전에 이 내용을 검토하세요.
이 페이지에서 가격, 제한 또는 계정에 관한 궁금증이 해결되지 않았다면, 요구 사항을 논의하려면 지원팀에 문의하세요.

가격

자세한 모델 가격 정보는 Serverless Inference 가격에서 확인하세요.

크레딧 추가 구매

Serverless Inference 크레딧은 한시적으로 Free, Pro, Academic 플랜에 포함됩니다. Enterprise 제공 여부는 달라질 수 있습니다. 크레딧을 모두 소진하면 다음과 같습니다.
  • Free 계정은 Serverless Inference를 계속 사용하려면 Billing 탭에서 종량제 Inference를 활성화하거나 유료 플랜으로 업그레이드해야 합니다. 종량제 활성화 또는 업그레이드.
  • W&B는 모델별 가격에 따라 Pro 플랜 사용자의 초과 사용량을 매월 청구합니다.
  • Enterprise 계정은 담당 Account Executive에게 문의해야 합니다.

계정 등급 및 기본 사용 한도

각 계정 등급에는 비용을 관리하고 예상치 못한 요금을 방지할 수 있도록 기본 지출 한도가 설정되어 있습니다. W&B는 유료 Inference 이용 시 선결제를 요구합니다. 다음 표는 각 등급의 기본 한도와 변경 요청 방법을 보여줍니다. 한도를 변경해야 하는 경우, 담당 Account Executive 또는 지원팀에 문의하여 한도를 조정하세요.
계정 등급기본 한도한도 변경 방법
Free월 $100Pro 또는 Enterprise로 업그레이드
Pro월 $6,000수동 검토를 위해 담당 Account Executive 또는 지원팀에 문의
Enterprise연 $700,000수동 검토를 위해 담당 Account Executive 또는 지원팀에 문의

동시성 제한

동시성 제한은 프로젝트 또는 사용자가 한 번에 처리 중일 수 있는 요청 수에 상한을 두어 서비스 품질을 보호합니다. 동시성 제한을 초과하면 API가 429 Concurrency limit reached for requests 응답을 반환합니다. 이 오류를 해결하려면 동시에 보내는 요청 수를 줄이세요. W&B는 W&B 프로젝트별로 그리고 사용자별로 동시성 제한을 적용합니다. 예를 들어 팀에 프로젝트가 3개 있으면 각 프로젝트에는 각각의 동시성 제한 한도가 적용됩니다. 사용 사례에 더 높은 한도가 필요하면 요구 사항을 논의하기 위해 지원팀에 문의하세요.

지리적 제한

Inference 서비스는 지원되는 지역에서만 이용할 수 있습니다. 자세한 내용은 Terms of Service를 참조하세요.

다음 단계

이제 가격, 한도 및 동시성 제한을 이해했으므로 계정 설정을 계속 진행하세요: