2026.05.31 접속자 69명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 2026년 AI 트렌드, 에이전트 시대 본격화되는 중이네요 [프롬프트] 데이터 분석할 때 쓰는 프롬프트 공유받고 싶어요 [프롬프트] 업무 자동화 프롬프트 몇 개월 써본 후기 [AI뉴스] AI 기본법 시행된 지 3개월... 기업들 지금 대비 안 하면 큰일 나네요 [프롬프트] 코드 리뷰 프롬프트 좋은 거 있으신가요? [프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [AI뉴스] 요즘 AI 업계 분위기 진짜 달라졌네요 - 에이전트 AI가 핫한 이유 [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요 [AI뉴스] 2026년 AI 트렌드, 에이전트 시대 본격화되는 중이네요 [프롬프트] 데이터 분석할 때 쓰는 프롬프트 공유받고 싶어요 [프롬프트] 업무 자동화 프롬프트 몇 개월 써본 후기 [AI뉴스] AI 기본법 시행된 지 3개월... 기업들 지금 대비 안 하면 큰일 나네요 [프롬프트] 코드 리뷰 프롬프트 좋은 거 있으신가요? [프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [AI뉴스] 요즘 AI 업계 분위기 진짜 달라졌네요 - 에이전트 AI가 핫한 이유 [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요

목록

API연동

LLM 컨텍스트 윈도우 늘리기 위해 뭐 써보셨나요?

현실주의자 2026.04.12 17:10 조회 106 추천 13 댓글 6건

요즘 일하다 보니 긴 문서 분석할 때 토큰 제한이 자꾸만 걸리더라고요. 클로드 같은 경우 20만 토큰까지 지원하는데, 실제로 그 정도 쓸 일이 얼마나 되는지 궁금해서 물어봅니다.

저는 주로 코드 리뷰나 기술 문서 정리할 때 LLM을 쓰는데, 가끔 예전 프로젝트 로그들을 한꺼번에 넣어서 패턴을 찾아달라고 하다 보니 자꾸 잘려요. 그럴 때마다 수동으로 내용을 쪼개서 여러 번 돌리는데 비효율적이거든요.

물론 최신 모델들이 컨텍스트 윈도우를 계속 늘리고 있긴 한데, 실제 체감 상으로는 어떨까요? 긴 컨텍스트를 처리할 때 응답 품질이 떨어진다는 말도 있고, 추론 속도도 느려진다고 들었는데... 이게 정말 그런지 궁금합니다. 아니면 그냥 프롬프트를 잘 짜면 상관없는 건지.

혹시 이런 문제 때문에 RAG나 벡터 DB 같은 걸 도입해보신 분 계신가요? 오픈소스로 로컬에서 돌릴 수 있는 게 있으면 좋은데, 셋업이 복잡하지 않은 솔루션이 있으면 추천받고 싶습니다. 지금 회사에선 보안상 외부 API도 제약이 있어서요.

추천 13 비추천 0

이전글최근에 Claude 3.5 Sonnet 써본 사람 있나요?26.04.13
다음글LLM 토큰 길이 제한 우회하는 방법들 실제로 효과 있나요?26.04.11

댓글 6

댓글목록

흐름타는개발자

26-04-13 05:20

저도 같은 문제 겪고 있었는데 결국 RAG로 넘어갔어요. 로컬에선 Ollama + LlamaIndex 조합 써봤는데 셋업이 생각보다 간단하더라고요.
컨텍스트 윈도우 늘렸을 때 응답 품질 떨어진다는 건 실제긴데, 특히 중간 부분 정보를 놓치는 경향이 있어요. 근데 RAG로 필요한 부분만 집중적으로 넘기니까 그 문제가 훨씬 나아졌습니다.
프롬프트 잘 짜는 것도 물론 도움 되지만, 로그 분석처럼 정말 긴 텍스트는 RAG가 진짜 효율적이에요. 특히 프로젝트 로그처럼 구조화된 데이터면 더더욱요.
그리고 혹시 회사

GPT덕후하나

26-04-13 18:57

저도 요즘 같은 문제로 고민 중이었네요. RAG 도입하니까 확실히 나아지더라고요.

인공지능개그맨

26-04-19 14:38

저도 같은 문제 겪다가 Ollama로 로컬에 Llama2 깔아서 쓰고 있어요. 셋업은 진짜 간단하고 보안도 문제없더라고요. 다만 성능은 클로드보다 떨어지는 건 어쩔 수 없네요 ㅎㅎ

인공지능개그맨

26-04-30 13:10

저도 그 문제 겪고 있어요 ㅠㅠ

조용한엔지니어

26-05-01 20:41

저도 비슷한 문제 겪고 있는데, 결국 RAG 도입하는 게 정답인 것 같아요. 로컬에선 Ollama + Langchain 조합으로 구성하니까 생각보다 셋업이 간단하더라고요.
긴 컨텍스트는 확실히 응답 품질이 떨어지는 게 느껴져요. 20만 토큰 다 쓰면 중간에 있는 정보를 자꾸 놓쳐서 결국 청킹해서 여러 번 도는 게 낫더라고요. 프롬프트 잘 짜도 한계가 있는 것 같습니다.

따뜻한코더

26-05-17 17:17

저도 그거 겪고 있어요 ㅠㅠ