최근 회사에서 문서 기반 QA 시스템 만들고 있는데 retrieval 단계에서 자꾸 관련 없는 문서들이 많이 섞여 올라와요. 임베딩 모델을 한두 번 바꿔봤는데도 precision이 별로 올라가지 않더라고요.
지금은 BM25랑 semantic search를 하이브리드로 섞어서 써보는 중인데, 더 근본적인 방법이 있을까요? 쿼리 리라이팅이나 레이크 퓨징 같은 거 써본 분 있으신가요? 아니면 파인튜닝된 임베딩 모델 추천해주실 수 있으면 좋겠습니다.
추천 0 비추천 0