2026.04.30 접속자 10명

로그인 | 회원가입 | AI 서비스

HOT

[프롬프트] GPT한테 물어볼 때 이렇게 하니까 답이 훨씬 낫더라요 [프롬프트] 문서 작성할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [기술 Q&A] LLM 로컬 배포하다가 느낀 거 공유합니다 [프롬프트] AI한테 물어볼 때 답변 품질이 달라지는데 프롬프트 팁 있으신가요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 미쳤네요... 구글 젬마4, 알리바바 큐원 근황 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [프롬프트] 번역 작업할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 기술 발전 속도가 미친 수준인데, 따라가기가 힘드네요 [프롬프트] GPT한테 물어볼 때 이렇게 하니까 답이 훨씬 낫더라요 [프롬프트] 문서 작성할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [기술 Q&A] LLM 로컬 배포하다가 느낀 거 공유합니다 [프롬프트] AI한테 물어볼 때 답변 품질이 달라지는데 프롬프트 팁 있으신가요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 미쳤네요... 구글 젬마4, 알리바바 큐원 근황 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [프롬프트] 번역 작업할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 기술 발전 속도가 미친 수준인데, 따라가기가 힘드네요

목록

API연동

RAG 시스템에서 context window 크기 문제 겪으신 분?

딥러닝장인 2026.04.30 08:51 조회 1 추천 0 댓글 0건

요즘 RAG 기반 챗봇 구축하고 있는데 vector DB에서 가져온 청크들을 context에 넣다 보니 토큰 오버플로우가 자꾸 생기더라고요. 지금은 상위 3~4개 청크만 선별하고 있는데 관련성 떨어지는 경우가 있어서 고민이네요.

혹시 이런 경우 어떻게 대처하시나요? 청크 크기를 더 줄이거나 랭크 재정렬(reranking) 모델을 따로 쓰는 게 나을까요? 아니면 프롬프트 최적화로 해결이 가능한 건지... 비용 효율까지 고려하면 어떤 방법이 가장 실용적인지 궁금합니다.

요즘 LLM들이 context window 길이도 늘어나는 추세더라도 실제 프로덕션에서는 비용이 문제가 되는 것 같아요.

추천 0 비추천 0

다음글LLM 파인튜닝 할 때 LoRA vs QLoRA 뭐가 더 실용적인가요?26.04.29

댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!