요즘 작은 모델들로 특정 도메인 작업 해보려고 하는데 LoRA로 할지 풀 파인튜닝으로 할지 고민이네요. 회사 GPU 리소스가 그리 많지 않아서 LoRA가 맞는 것 같기도 하고... 근데 정확도는 풀 파인튜닝이 좀 더 낫지 않나 싶거든요.
실제로 프로덕션 환경에서 둘을 다 써본 분들은 체감상 어떤 차이를 느끼셨나요? 특히 토큰 생성 속도나 품질 면에서요. 아니면 요즘은 LoRA도 충분히 좋아져서 굳이 풀 파인튜닝까지 갈 필요 없는 상황이 많은 건가요? 경험담 있으면 공유 부탁드립니다.
추천 1 비추천 0