최근에 회사에서 특정 도메인용 모델을 만들어야 하는데 파인튜닝 방향을 못 잡고 있네요. 기존엔 GPT-3.5 API 쓰다가 비용도 줄이고 컨트롤도 더 하려고 오픈소스 모델로 가려는 상황이거든요.
Llama 2 기반으로 LoRA 적용해볼까 싶긴 한데 정확도를 얼마나 확보할 수 있을지 걱정이에요. 사실 QLoRA도 있긴 한데 A100 몇 개 없이 4090으로 학습하기엔 한계가 있을 것 같고요. 혹시 요즘 프로덕션에서 쓰는 실제 방법이 뭔지 궁금합니다.
데이터셋은 그나마 10만 개 정도 확보했으니 충분할 거 같은데 전처리가 제일 힘드네요 ㅠㅠ
추천 0 비추천 0