2026.05.31 접속자 63명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 2026년 AI 트렌드, 에이전트 시대 본격화되는 중이네요 [프롬프트] 데이터 분석할 때 쓰는 프롬프트 공유받고 싶어요 [프롬프트] 업무 자동화 프롬프트 몇 개월 써본 후기 [AI뉴스] AI 기본법 시행된 지 3개월... 기업들 지금 대비 안 하면 큰일 나네요 [프롬프트] 코드 리뷰 프롬프트 좋은 거 있으신가요? [프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [AI뉴스] 요즘 AI 업계 분위기 진짜 달라졌네요 - 에이전트 AI가 핫한 이유 [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요 [AI뉴스] 2026년 AI 트렌드, 에이전트 시대 본격화되는 중이네요 [프롬프트] 데이터 분석할 때 쓰는 프롬프트 공유받고 싶어요 [프롬프트] 업무 자동화 프롬프트 몇 개월 써본 후기 [AI뉴스] AI 기본법 시행된 지 3개월... 기업들 지금 대비 안 하면 큰일 나네요 [프롬프트] 코드 리뷰 프롬프트 좋은 거 있으신가요? [프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [AI뉴스] 요즘 AI 업계 분위기 진짜 달라졌네요 - 에이전트 AI가 핫한 이유 [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요

목록

프롬프트

최근에 LLM 응답 속도 체감상 느려진 거 아닌가요?

조용한엔지니어 2026.04.08 10:35 조회 131 추천 14 댓글 4건

요즘 GPT-4o랑 Claude 3.5 쓰다 보면 예전보다 응답이 좀 느린 것 같은데 저만 그런 건가요? 특히 코드 생성할 때 토큰이 쏟아져 나올 때 체감 지연이 확 드는 거 같거든요. 서버 부하 때문인지 아니면 뭔가 업데이트된 거 있는지 궁금하네요.

회사에서도 그런 얘기가 나왔는데 혹시 최근에 API 성능 이슈 있었던 거 있으시면 알려줄래요? 아니면 체감 속도 개선할 만한 팁이라도 있으면 공유 부탁드립니다.

추천 14 비추천 0

이전글LLM 프롬프트 최적화 방법 뭐 쓰세요?26.04.09
다음글LLM 파인튜닝할 때 LoRA vs 전체 파라미터 학습 어떻게 선택하세요?26.04.06

댓글 4

댓글목록

요정

26-04-08 15:09

저도 요즘 체감하고 있어요 ㅠㅠ

현실주의자

26-04-14 07:06

GPT-4o는 작년부터 확실히 체감상 느려진 것 같습니다. 특히 스트리밍 토큰 속도가 눈에 띄게 떨어졌더라고요. Claude는 상대적으로 낫지만 역시 비슷한 패턴이 보여요.
OpenAI 쪽에서 공식 발표는 없었던 것 같은데, 커뮤니티에서는 서버 부하와 함께 약간의 양자화나 모델 최적화 때문일 거란 추측이 많습니다. RPM/TPM 제한도 점점 빡빡해지고 있으니까요.
속도 개선 팁이라면 API 사용 시 max_tokens를 명시적으로 제한하고, 스트리밍 활성화하면 체감상 좀 낫습니다. 아니면 Claude API가 가성비 대비 응답 속도는 꽤 안정적이니

흐름타는개발자

26-05-10 01:40

저도 요즘 확실히 느려진 것 같아요 ㅋㅋ

현실주의자

26-05-18 19:18

저도 똑같이 느껴요. 특히 GPT-4o가 최근 몇 달 전부터 확실히 느려진 것 같더라고요. OpenAI에서 공식 발표는 없었던 것 같은데 사용자들 사이에서 계속 이런 얘기가 나오네요.
혹시 temperature나 top_p 값 조정해봤어요? API 호출할 때 저는 temperature를 0.7 정도로 낮췄더니 조금 나아지긴 했거든요. 그리고 스트리밍 응답 대신 일괄 응답을 받는 쪽으로 바꿔봐도 체감상 차이가 있을 수 있어요.
Claude는 요새 프롬프트 캐싱 제대로 활용하면 꽤 빨라지는데 코드 생성 작업이면 시스템 프롬프트를 캐싱하는 것도 고려해