2026.06.17 접속자 83
로그인 회원가입
HOT
[AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요 [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [AI뉴스] OpenAI가 IPO 신청했대요... 1조 달러 목표면 진짜 어마하네요
프롬프트

RAG 시스템 구축했는데 검색 정확도가 생각보다 낮네요

AI소연이 2026.05.20 20:46 조회 75 추천 10 댓글 1건
회사에서 자사 문서 기반으로 챗봇 만들려고 RAG 구축을 시작했는데 쉽지 않네요. 임베딩 모델로 bge-large-ko 썼고 벡터DB는 pinecone 쓰고 있거든요.

그런데 문제가 사용자 질문이 조금 다르게 들어오면 관련 문서를 못 찾아내더라고요. 특히 동의어나 표현만 조금 달라져도 유사도 스코어가 뚝 떨어진다는 게 문제예요. 혹시 다른 분들도 비슷한 경험 있으신가요? 쿼리 전처리를 더 해야 하나 싶긴 한데...

참고로 top-k는 3, 임계값은 0.7로 설정해뒀는데 이 정도가 적당한지도 모르겠습니다.
추천 10 비추천 0
댓글 1

댓글목록

profile_image
딥러닝장인
저도 비슷한 거 겪었는데 임베딩 모델 자체 한계가 있는 것 같아요. bge는 좋긴 한데 한국어 동의어 처리가 그렇게 강하진 않더라고요. 저는 결국 쿼리 확장하고 top-k 늘려서 해결했는데, 혹시 임계값을 조금 내려보신 적 있으세요? 0.7은 좀 높은 것 같기도 하고요.