2026.07.31 접속자 45명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 요즘 AI 도입한 회사들 다들 어떻게 되어가고 있어요? [AI뉴스] 이제 생성형 AI는 그냥 도구가 아니더라... 에이전틱 AI 시대가 온다는데 [프롬프트] AI한테 요구사항 정리해달라고 하는데 자꾸 틀린 정보를 줘요 [AI뉴스] 요즘 딥러닝 논문들 방향이 좀 달라졌더라고요 [프롬프트] AI한테 물어보는 방식 바꿔보니까 답의 질이 확 달라지더라고요 [AI뉴스] 올해 LLM 모델들 계속 쏟아지고 있네요 [AI뉴스] 요즘 LLM 모델들이 쏟아져 나오는데 뭘 써야 할지 모르겠어요 [프롬프트] 업무 지시사항을 프롬프트로 변환하니까 결과가 달라지네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [자유게시판] 편의점 계란말이 브랜드 추천해주세요 [AI뉴스] 요즘 AI 도입한 회사들 다들 어떻게 되어가고 있어요? [AI뉴스] 이제 생성형 AI는 그냥 도구가 아니더라... 에이전틱 AI 시대가 온다는데 [프롬프트] AI한테 요구사항 정리해달라고 하는데 자꾸 틀린 정보를 줘요 [AI뉴스] 요즘 딥러닝 논문들 방향이 좀 달라졌더라고요 [프롬프트] AI한테 물어보는 방식 바꿔보니까 답의 질이 확 달라지더라고요 [AI뉴스] 올해 LLM 모델들 계속 쏟아지고 있네요 [AI뉴스] 요즘 LLM 모델들이 쏟아져 나오는데 뭘 써야 할지 모르겠어요 [프롬프트] 업무 지시사항을 프롬프트로 변환하니까 결과가 달라지네요 [프롬프트] 코드 리뷰 요청할 때 쓸 만한 프롬프트 있으신가요? [자유게시판] 편의점 계란말이 브랜드 추천해주세요

목록

API연동

최근에 RAG 구현하면서 느낀 건데 벡터 DB 선택이 생각보다 중요하네요

딥러너 2026.05.04 06:15 조회 211 추천 13 댓글 1건

프로젝트에서 RAG 시스템 만들어봤는데 처음엔 그냥 Pinecone으로 대충 시작했거든요. 그런데 데이터 규모가 커지니까 비용이 장난 아니더라고요. 그래서 로컬에서 Milvus로 갈아탔는데 확실히 달라요.

특히 재현율(recall) 차이가 신경 쓰였어요. 벡터 임베딩 모델도 중요하지만 DB의 인덱싱 방식에 따라 검색 정확도가 꽤 달라지더라고요. 근데 운영 복잡도는 Milvus가 훨씬 높은 게 단점이긴 합니다.

혹시 프로덕션 환경에서 RAG 운영하시는 분들 계신가요? 어떤 벡터 DB 쓰시는지, 그리고 임베딩 모델은 뭐 선택하셨는지 궁금해요. 한국어 데이터 다루실 때 특별히 신경 써야 할 게 있으면 팁 공유해주세요.

추천 13 비추천 0

이전글LLM 토큰 수 정확히 계산하는 방법 공유합니다26.05.04
다음글RAG 시스템에서 context window 크기 문제 겪으신 분?26.04.30

댓글 1

댓글목록

GPT덕후하나

26-06-23 15:12

저도 비슷한 경험했는데 Pinecone 비용이 진짜 무섭더라고요 ㅋㅋ 저는 결국 Weaviate로 셀프 호스팅하게 됐어요. Milvus도 좋다고 들었는데 운영 복잡도가 있군요.
한국어는 임베딩 모델 선택이 정말 중요한데, 저는 ko-sbert보다 bge-m3이 재현율이 더 좋더라고요. 특히 한국어 특화 모델들이 일반 임베딩보다 훨씬 나으니 꼭 시도해보세요. 인덱싱은 HNSW 방식이 대부분 문제없는데 데이터 규모가 어느 정도인가요?