2026.05.14 접속자 15
로그인 회원가입
HOT
[AI뉴스] 요즘 뜨는 LLM 모델들 정리해봤는데 너무 많네요 ㅋㅋ [AI뉴스] 요즘 AI 추세 정리해봤는데, 생성형 AI는 이미 과거라고? [프롬프트] Claude한테 좋은 결과 뽑아내는 프롬프트 팁 있으신가요? [AI뉴스] 한국 AI 기본법 시행 앞두고 국내외 규제 경쟁 심화되는 중 [자유게시판] 요즘 점심 뭐 먹으세요? [자유게시판] 요즘 왜 다들 커피는 안 마시고 에너지 드링크만 마셔요? [자유게시판] 편의점 알바 3개월 해본 후기 및 꿀팁 공유 [프롬프트] 데이터 분석 프롬프트 어떻게 쓰시는데요? 좋은 사례 있으면 공유 부탁합니다 [자유게시판] 요즘 회사 점심시간에 혼자 먹는 게 맞나요? [자유게시판] 요즘 직장인들 점심시간 뭐 하세요? [AI뉴스] 요즘 뜨는 LLM 모델들 정리해봤는데 너무 많네요 ㅋㅋ [AI뉴스] 요즘 AI 추세 정리해봤는데, 생성형 AI는 이미 과거라고? [프롬프트] Claude한테 좋은 결과 뽑아내는 프롬프트 팁 있으신가요? [AI뉴스] 한국 AI 기본법 시행 앞두고 국내외 규제 경쟁 심화되는 중 [자유게시판] 요즘 점심 뭐 먹으세요? [자유게시판] 요즘 왜 다들 커피는 안 마시고 에너지 드링크만 마셔요? [자유게시판] 편의점 알바 3개월 해본 후기 및 꿀팁 공유 [프롬프트] 데이터 분석 프롬프트 어떻게 쓰시는데요? 좋은 사례 있으면 공유 부탁합니다 [자유게시판] 요즘 회사 점심시간에 혼자 먹는 게 맞나요? [자유게시판] 요즘 직장인들 점심시간 뭐 하세요?
활용법

RAG 구현할 때 청킹 전략 어떻게 하세요?

AI새싹 2026.03.30 03:16 조회 119 추천 14 댓글 2건
최근 RAG 프로젝트 하면서 청킹 방식으로 한참 고민했는데, 고정 크기 청킹만 해도 되는지 궁금하네요. 지금은 512 토큰 기준으로 겹치게 자르고 있는데 검색 정확도가 생각보다 낮더라고요.

Recursive 청킹이나 의미 기반 청킹 써본 분들 있으신가요? 오버헤드 대비 성능 개선이 얼마나 되는지 궁금합니다. 지금 문서는 기술 문서와 뉴스 기사 섞여 있어서 청킹 전략을 따로 써야 할 것 같은데 참고할 만한 사례나 팁이 있으면 공유 부탁드립니다.
추천 14 비추천 0
댓글 2

댓글목록

profile_image
코드리뷰어
저도 같은 문제로 한참 고민했는데, 고정 크기만으로는 한계가 있더라고요. 특히 기술 문서처럼 구조가 명확한 경우 마크다운 기반으로 헤더 단위로 먼저 나누고, 그 안에서만 청킹하니까 검색 정확도가 확 올라갔어요.
의미 기반 청킹(semantic chunking)도 시도해봤는데, 정확도는 좋은데 비용이 장난 아니더라고요 ㅎㅎ 매번 임베딩 모델 돌려야 해서 레이턴시가 증가하고. 결론적으로는 문서 타입별로 전략을 다르게 가져가는 게 최고인 것 같아요.
뉴스 기사 같은 경우 문단 단위 + 문장 오버랩으로 충분하고, 기술 문서는
profile_image
오늘도살자
저도 같은 문제 겪었는데 recursive 청킹으로 바꾸니까 확실히 나아지더라고요. 근데 임베딩 비용이 좀 올라가는 게 흠이네요. 문서 타입별로 청킹 전략 다르게 가져가는 게 정답인 것 같습니다.