2026.05.03 접속자 21
로그인 회원가입
HOT
[AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [AI뉴스] 2026년 AI 주요 뉴스 정리해봤는데 이거 진짜 가능한 수준인가요? [AI뉴스] TIME 선정 AI 빅10 발표… 중국이 자리 잡았네요 [프롬프트] 코드 리뷰 요청할 때 프롬프트 이렇게 해보세요 [프롬프트] Claude한테 물어볼 때 좋은 프롬프트 팁 있으신가요? [AI뉴스] 요즘 AI 기업들 데이터센터 투자에 정신없네요 ㅋㅋ [AI뉴스] 최근 빅테크의 AI 인프라 투자 규모가 미쳤네요... 이게 정상일까요? [프롬프트] 프롬프트 엔지니어링도 결국 '질문 잘 하기'더라고요 [프롬프트] 프롬프트 작성할 때 "역할 지정"이 얼마나 중요한지 깨달았어요 [프롬프트] 프롬프트 구체적으로 쓸수록 답이 달라지더라고요 [AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [AI뉴스] 2026년 AI 주요 뉴스 정리해봤는데 이거 진짜 가능한 수준인가요? [AI뉴스] TIME 선정 AI 빅10 발표… 중국이 자리 잡았네요 [프롬프트] 코드 리뷰 요청할 때 프롬프트 이렇게 해보세요 [프롬프트] Claude한테 물어볼 때 좋은 프롬프트 팁 있으신가요? [AI뉴스] 요즘 AI 기업들 데이터센터 투자에 정신없네요 ㅋㅋ [AI뉴스] 최근 빅테크의 AI 인프라 투자 규모가 미쳤네요... 이게 정상일까요? [프롬프트] 프롬프트 엔지니어링도 결국 '질문 잘 하기'더라고요 [프롬프트] 프롬프트 작성할 때 "역할 지정"이 얼마나 중요한지 깨달았어요 [프롬프트] 프롬프트 구체적으로 쓸수록 답이 달라지더라고요
API연동

RAG 시스템에서 context window 크기 문제 겪으신 분?

딥러닝장인 2026.04.30 08:51 조회 13 추천 2 댓글 0건
요즘 RAG 기반 챗봇 구축하고 있는데 vector DB에서 가져온 청크들을 context에 넣다 보니 토큰 오버플로우가 자꾸 생기더라고요. 지금은 상위 3~4개 청크만 선별하고 있는데 관련성 떨어지는 경우가 있어서 고민이네요.

혹시 이런 경우 어떻게 대처하시나요? 청크 크기를 더 줄이거나 랭크 재정렬(reranking) 모델을 따로 쓰는 게 나을까요? 아니면 프롬프트 최적화로 해결이 가능한 건지... 비용 효율까지 고려하면 어떤 방법이 가장 실용적인지 궁금합니다.

요즘 LLM들이 context window 길이도 늘어나는 추세더라도 실제 프로덕션에서는 비용이 문제가 되는 것 같아요.
추천 2 비추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!