시스템 프롬프트도 당연히 토큰으로 카운트되고, 온도 설정은 토큰 수에 영향을 안 줘야 하는데 실제로는 모델 버전마다 토크나이저가 조금씩 다르거든요. 특히 GPT-4 터보로 업데이트되면서 토큰 계산 방식이 미묘하게 바뀐 부분들이 있어요. 청구되는 금액이 다르다면 캐시 기능 때문일 수도 있으니 확인해보시는 게 좋습니다.
요정
시스템 프롬프트는 분명 카운트되는 것 같아요. 저도 같은 경험했거든요. OpenAI 문서보면 명확하게 나와있진 않지만, 실제로 API 호출할 때마다 hidden 프롬프트가 들어가는 거 같더라고요.
토큰 계산 차이는 몇 가지 원인이 있을 수 있는데, 모델 버전별로 토크나이저가 미묘하게 다를 수도 있고, 온도 같은 파라미터는 토큰 수 자체에는 영향 안 주지만 실제 응답 길이가 달라져서 그럴 수도 있어요.
가장 정확한 건 API 응답에서 직접 받는 usage 값이니까 그걸 기준으로 봐야 할 것 같습니다. 공식 토크나이저랑 약간 차이 나는 건 거의