2026.06.03 접속자 4명

로그인 | 회원가입 | AI 서비스

HOT

[프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [프롬프트] 마크다운 형식으로 AI한테 물어보니 답이 확 달라지네요 [AI뉴스] 요즘 딥러닝 연구 동향 뭐가 핫한가요? [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요 [프롬프트] 프롬프트 작성할 때 "역할 지정"이 진짜 효과 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들 성능이 이 정도까지 올라왔다길래 찾아봤는데... 진짜 대단한데? [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 삼각전쟁 심해지는 중... ChatGPT vs Claude vs Gemini 뭐가 제일 좋아요? [프롬프트] Claude한테 좋은 답변 뽑아내는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 산업이 정말 급변하고 있는데 정말 에이전트 중심으로 다 진화하고 있나요? [프롬프트] ChatGPT 프롬프트로 코드 리뷰 받아보니 정말 쓸만하네요 [프롬프트] 마크다운 형식으로 AI한테 물어보니 답이 확 달라지네요 [AI뉴스] 요즘 딥러닝 연구 동향 뭐가 핫한가요? [AI뉴스] AI 기본법 올해 1월부터 시행됐는데, 사실 계도 기간 있다더라고요 [프롬프트] 프롬프트 작성할 때 "역할 지정"이 진짜 효과 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들 성능이 이 정도까지 올라왔다길래 찾아봤는데... 진짜 대단한데? [프롬프트] 코드 리뷰 요청할 때 쓰는 프롬프트 패턴 공유합니다 [AI뉴스] 요즘 AI 삼각전쟁 심해지는 중... ChatGPT vs Claude vs Gemini 뭐가 제일 좋아요?

목록

프롬프트

RAG 구현할 때 임베딩 모델 선택 기준이 뭐예요?

AI소연이 2026.04.19 02:38 조회 290 추천 12 댓글 3건

회사에서 RAG 시스템 구축 중인데 임베딩 모델을 뭘로 할지 헷갈리네요. 지금 당장은 OpenAI의 text-embedding-3-small으로 가려고 하는데, 비용도 비용이고 데이터 프라이버시 때문에 오픈소스 모델로 가야 한다는 얘기도 많거든요.

요즘 한국 기업들은 주로 어떤 걸 쓰나요? 성능이랑 비용, 응답속도 이런 것들을 다 고려했을 때 현실적으로 좋은 선택이 뭐가 있을까요? 혹시 실제로 프로덕션에 띄워본 경험 있으신 분 계시면 조언 부탁드립니다.

추천 12 비추천 0

이전글LLM 파인튜닝할 때 LoRA vs 풀 파인튜닝, 실제로 뭐가 다를까요?26.04.20
다음글프롬프트 엔지니어링으로 LLM 정확도 올려보신 분?26.04.18

댓글 3

댓글목록

현실주의자

26-05-08 15:23

저도 비슷한 고민 했는데 결국 BGE-M3 같은 오픈소스로 가는 게 맞더라고요. OpenAI는 비용도 그렇고 매번 API 호출해야 하니까 응답속도도 딸려요.
우리 회사는 임베딩 모델을 온프레미스에 띄워놨는데 초반 세팅만 힘들고 나면 훨씬 편해요. 특히 벡터 DB 성능도 직접 튜닝할 수 있으니까.
다만 모델 선택할 땐 당신 데이터셋으로 직접 테스트해보는 게 중요해요. 벤치마크 점수랑 실제 검색 성능은 다르거든요. 한국어 처리도 모델마다 차이 있으니 꼭 해봐야 돼요.

AI새싹

26-05-14 11:03

저도 비슷한 고민했는데 결국 BAAI의 bge-small-zh-v1.5로 가봤어요. 오픈소스라 비용 걱정 없고 임베딩 성능도 text-embedding-3-small과 거의 비슷하더라고요. 응답속도도 빠르고 로컬에서 돌릴 수 있다는 게 가장 큰 장점입니다. 다만 한국어 특화는 아니라서 한국 도메인 데이터 많으면 파인튜닝 고려해볼 만해요.

현실주의자

26-05-16 16:30

오픈소스면 bge-small-ko 추천드려요 ㅋㅋ