2026.06.17 접속자 77명

로그인 | 회원가입 | AI 서비스

HOT

[기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요?

목록

프롬프트

RAG 구현할 때 임베딩 모델 선택 기준이 뭐예요?

AI소연이 2026.04.19 02:38 조회 328 추천 13 댓글 4건

회사에서 RAG 시스템 구축 중인데 임베딩 모델을 뭘로 할지 헷갈리네요. 지금 당장은 OpenAI의 text-embedding-3-small으로 가려고 하는데, 비용도 비용이고 데이터 프라이버시 때문에 오픈소스 모델로 가야 한다는 얘기도 많거든요.

요즘 한국 기업들은 주로 어떤 걸 쓰나요? 성능이랑 비용, 응답속도 이런 것들을 다 고려했을 때 현실적으로 좋은 선택이 뭐가 있을까요? 혹시 실제로 프로덕션에 띄워본 경험 있으신 분 계시면 조언 부탁드립니다.

추천 13 비추천 0

이전글LLM 파인튜닝 vs RAG, 실무에서 어떤 걸 먼저 시도해야 할까요?26.04.21
다음글프롬프트 엔지니어링으로 LLM 정확도 올려보신 분?26.04.18

댓글 4

댓글목록

현실주의자

26-05-08 15:23

저도 비슷한 고민 했는데 결국 BGE-M3 같은 오픈소스로 가는 게 맞더라고요. OpenAI는 비용도 그렇고 매번 API 호출해야 하니까 응답속도도 딸려요.
우리 회사는 임베딩 모델을 온프레미스에 띄워놨는데 초반 세팅만 힘들고 나면 훨씬 편해요. 특히 벡터 DB 성능도 직접 튜닝할 수 있으니까.
다만 모델 선택할 땐 당신 데이터셋으로 직접 테스트해보는 게 중요해요. 벤치마크 점수랑 실제 검색 성능은 다르거든요. 한국어 처리도 모델마다 차이 있으니 꼭 해봐야 돼요.

AI새싹

26-05-14 11:03

저도 비슷한 고민했는데 결국 BAAI의 bge-small-zh-v1.5로 가봤어요. 오픈소스라 비용 걱정 없고 임베딩 성능도 text-embedding-3-small과 거의 비슷하더라고요. 응답속도도 빠르고 로컬에서 돌릴 수 있다는 게 가장 큰 장점입니다. 다만 한국어 특화는 아니라서 한국 도메인 데이터 많으면 파인튜닝 고려해볼 만해요.

현실주의자

26-05-16 16:30

오픈소스면 bge-small-ko 추천드려요 ㅋㅋ

궁금하면

26-06-08 10:39

저도 요즘 그 고민 중이에요 ㅋㅋ text-embedding-3-small 비용 생각하면 진짜 아깝더라고요