LLM 파인튜닝 vs RAG, 실무에서 어떤 걸 먼저 시도해야 할까요? > 기술 Q&A

댓글목록

딥러닝장인

26-04-26 09:42

저도 비슷한 고민을 했는데 결론은 RAG부터 시작하는 게 맞더라고요. 일단 비용 효율이 확실히 좋고 최신 데이터 반영이 쉬워서 빠르게 PoC를 만들 수 있거든요.
다만 RAG만으로는 한계가 생기는 순간이 분명 있어요. 특히 도메인 특화 표현이나 복잡한 추론이 필요할 땐 말이죠. 그 시점에서 파인튜닝을 고려하는 게 현실적인 것 같습니다.
저희는 RAG로 시작했다가 6개월 정도 운영하면서 모델의 응답 패턴이 부족하다는 걸 느껴서 소규모 파인튜닝을 추가했어요. 근데 처음부터 파인튜닝을 준비했다면 데이터 수집

인공지능개그맨

26-04-26 19:36

저도 똑같은 고민 중이네요 ㅠㅠ

GPT덕후하나

26-05-06 08:19

실무 경험상 RAG부터 시작하는 게 맞는 것 같아요. 비용 대비 효과가 훨씬 낫거든요. 저희도 처음엔 파인튜닝으로 생각했는데 데이터 정제 비용이 생각보다 많이 들더라고요. RAG로 시작해서 부족한 부분이 명확해지면 그때 파인튜닝 고려해도 늦지 않습니다. 특히 초반엔 도메인 특화 표현도 프롬프트 엔지니어링으로 상당 부분 해결되더라고요.

코드리뷰어

26-05-16 09:15

저도 비슷한 상황을 겪었는데, 결론은 일단 RAG부터 시작하고 부족함이 느껴질 때 파인튜닝을 더하는 게 현실적이더라고요. 왜냐하면 RAG로 80%는 커버되거든요. 파인튜닝은 정말 도메인 특화 표현이나 추론 로직이 중요할 때만 의미 있는데, 그전에 데이터 품질과 벡터 DB 구성부터 완성하는 게 훨씬 ROI가 좋았습니다. 우리는 요즘 하이브리드로 가고 있어요.

코드리뷰어

26-06-03 08:39

RAG로 시작하되 3-4개월 뒤 성능 천장이 보이면 파인튜닝 검토하는 게 현실적이더라고요. 예전에 이런 삽질을 했는데, 처음부터 파인튜닝하려고 학습 데이터 몇 달 준비했다가 RAG만으로도 충분하다는 걸 깨달아서 한숨 나왔거든요.
도메인 특화 표현이나 추론이 진짜 중요한 부분인지 먼저 RAG + 프롬프트 엔지니어링으로 충분한지 검증하고 나서 파인튜닝 여부를 결정하는 게 시간과 비용 관점에서 합리적인 것 같아요. 파인튜닝은 투자 규모가 크니까요.
다만 한 가지 조언은, RAG 벡터 DB 구성할 때부터 나중에 파