저도 같은 경험 많이 했어요. 공식 토크나이저랑 실제 청구액이 다른 건 API 호출할 때마다 추가 토큰이 붙기 때문일 수도 있습니다. 특히 시스템 프롬프트는 매 요청마다 포함되니까 숨겨진 토큰이 있을 수 있거든요. 저는 실제로 몇 번 테스트 호출해서 로그에 usage 필드를 기록해둔 다음에 평균값으로 계산하더라고요. 정확도는 70% 정도지만 예산 계획할 땐 충분하더라고요 ㅎㅎ 공식 문서에 나온 edge case 체크해보시는 것도 추천드립니다.
딥러너
저도 같은 경험했어요. 시스템 프롬프트는 따옴표 처리 방식이나 개행 문자 때문에 예상과 다를 수 있거든요. 그래서 저는 항상 API 응답의 usage 필드를 신뢰하고, 로컬 토크나이저는 참고만 하는 중입니다. 정확한 계산은 실제 API 호출 후에 나온 수치로 검증하는 게 가장 확실하더라고요.
인공지능개그맨
저도 같은 문제 겪었는데 공식 토크나이저로 먼저 체크한 후에 실제 API 호출해서 completion_tokens 값이랑 비교하는 게 가장 정확하더라고요. 시스템 프롬프트는 매 요청마다 포함되니까 그 부분에서 차이가 날 수 있어요. 혹시 vision 모델 쓰신다면 이미지 토큰도 있으니 체크해보세요.
현실주의자
시스템 프롬프트는 따로 토큰화되는 부분이 있어서 그런 것 같아요. 공식 토크나이저로 체크할 때 system, user, assistant 역할별로 분리해서 계산해보면 정확하더라고요. 실제 API 호출할 때도 각 메시지 역할이 몇 토큰씩 먹는지 구분해서 봐야 해요.
AI소연이
저도 같은 문제 겪었는데 openai-python 라이브러리의 tiktoken 쓰니까 거의 일치하더라고요. 웹 토크나이저보다 라이브러리가 더 정확한 것 같아요. 시스템 프롬프트도 일반 텍스트처럼 계산되니까 함께 넣고 체크해보세요.
조용한엔지니어
저도 같은 문제 겪었는데 공식 토크나이저 써도 실제 청구액이 다르더라고요. 이유는 API 호출할 때 메시지 포매팅 오버헤드가 추가되기 때문이거든요. 각 메시지마다 4토큰씩 더 들어간다고 생각하고 계산하니까 훨씬 정확해졌어요. 그리고 시스템 프롬프트도 일반 메시지처럼 토큰이 소모되는데 오픈AI 문서에서 놓치기 쉬운 부분이더라고요.
딥러너
저도 같은 문제 겪었는데 tiktoken 라이브러리로 직접 계산해보니까 오픈AI 계산과 거의 일치더라고요. 시스템 프롬프트는 매 요청마다 포함되니까 빠뜨리지 마시고, 특수 토큰들(예: message 구분자)이 추가되는 부분도 체크해보세요. 공식 문서의 토큰 계산 예제 보면 도움될 거 같습니다.