2026.06.16 접속자 59
로그인 회원가입
HOT
[기술 Q&A] Transformer 모델의 positional encoding 방식 바꿔도 괜찮나요? [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [기술 Q&A] Transformer 모델의 positional encoding 방식 바꿔도 괜찮나요? [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요?
API연동

최근에 RAG 구현하면서 느낀 건데 벡터 DB 선택이 생각보다 중요하네요

딥러너 2026.05.04 06:15 조회 99 추천 12 댓글 0건
프로젝트에서 RAG 시스템 만들어봤는데 처음엔 그냥 Pinecone으로 대충 시작했거든요. 그런데 데이터 규모가 커지니까 비용이 장난 아니더라고요. 그래서 로컬에서 Milvus로 갈아탔는데 확실히 달라요.

특히 재현율(recall) 차이가 신경 쓰였어요. 벡터 임베딩 모델도 중요하지만 DB의 인덱싱 방식에 따라 검색 정확도가 꽤 달라지더라고요. 근데 운영 복잡도는 Milvus가 훨씬 높은 게 단점이긴 합니다.

혹시 프로덕션 환경에서 RAG 운영하시는 분들 계신가요? 어떤 벡터 DB 쓰시는지, 그리고 임베딩 모델은 뭐 선택하셨는지 궁금해요. 한국어 데이터 다루실 때 특별히 신경 써야 할 게 있으면 팁 공유해주세요.
추천 12 비추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!