최근에 프로젝트에서 특정 도메인 데이터로 LLM 파인튜닝 해야 하는데, 프레임워크 선택이 자꾸 고민이 돼요. 지금까지는 Hugging Face Transformers만 썼거든요. 근데 최근에 LoRA 같은 파라미터 효율적인 방식들이 많이 나오면서, 그게 더 나을 것 같기도 하고요.
혹시 최근에 파인튜닝 프로젝트 하신 분들 계신가요? 보통 어떤 도구 써서 진행하시는지, 특히 비용이랑 속도 측면에서 어떤 차이가 있는지 궁금합니다. 데이터셋은 약 50만 개 정도의 토큰이고, V100 GPU 한두 개 정도에서 돌려야 하는 상황이거든요.