2026.05.02 접속자 29
로그인 회원가입
HOT
[AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [프롬프트] 업무 보고서 쓸 때 써먹는 프롬프트 공유합니다 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [기술 Q&A] 요즘 LLM 컨텍스트 윈도우 경쟁이 좀 이상하지 않나요? [AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [프롬프트] ChatGPT한테 같은 질문을 여러 번 해도 답변이 자꾸 달라지는데 이게 정상인가요? [AI뉴스] 2026년 AI 주요 뉴스 정리해봤는데 이거 진짜 가능한 수준인가요? [프롬프트] 코드 리뷰 요청할 때 프롬프트 이렇게 해보세요 [프롬프트] 프롬프트 엔지니어링도 결국 '질문 잘 하기'더라고요 [AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [프롬프트] 업무 보고서 쓸 때 써먹는 프롬프트 공유합니다 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [기술 Q&A] 요즘 LLM 컨텍스트 윈도우 경쟁이 좀 이상하지 않나요? [AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [프롬프트] ChatGPT한테 같은 질문을 여러 번 해도 답변이 자꾸 달라지는데 이게 정상인가요? [AI뉴스] 2026년 AI 주요 뉴스 정리해봤는데 이거 진짜 가능한 수준인가요? [프롬프트] 코드 리뷰 요청할 때 프롬프트 이렇게 해보세요 [프롬프트] 프롬프트 엔지니어링도 결국 '질문 잘 하기'더라고요
활용법

RAG 구현할 때 청킹 전략 어떻게 하세요?

AI새싹 2026.03.30 03:16 조회 86 추천 14 댓글 1건
최근 RAG 프로젝트 하면서 청킹 방식으로 한참 고민했는데, 고정 크기 청킹만 해도 되는지 궁금하네요. 지금은 512 토큰 기준으로 겹치게 자르고 있는데 검색 정확도가 생각보다 낮더라고요.

Recursive 청킹이나 의미 기반 청킹 써본 분들 있으신가요? 오버헤드 대비 성능 개선이 얼마나 되는지 궁금합니다. 지금 문서는 기술 문서와 뉴스 기사 섞여 있어서 청킹 전략을 따로 써야 할 것 같은데 참고할 만한 사례나 팁이 있으면 공유 부탁드립니다.
추천 14 비추천 0
댓글 1

댓글목록

profile_image
코드리뷰어
저도 같은 문제로 한참 고민했는데, 고정 크기만으로는 한계가 있더라고요. 특히 기술 문서처럼 구조가 명확한 경우 마크다운 기반으로 헤더 단위로 먼저 나누고, 그 안에서만 청킹하니까 검색 정확도가 확 올라갔어요.
의미 기반 청킹(semantic chunking)도 시도해봤는데, 정확도는 좋은데 비용이 장난 아니더라고요 ㅎㅎ 매번 임베딩 모델 돌려야 해서 레이턴시가 증가하고. 결론적으로는 문서 타입별로 전략을 다르게 가져가는 게 최고인 것 같아요.
뉴스 기사 같은 경우 문단 단위 + 문장 오버랩으로 충분하고, 기술 문서는