저도 비슷한 경험이 있는데 7,000개 정도면 사실 파인튜닝보단 프롬프트 엔지니어링이 나을 수 있어요. 파인튜닝은 최소 10만 개 이상의 고품질 데이터가 있어야 효과를 보더라고요. 과적합 문제도 데이터가 부족하면 필연적이고요. 도메인 특화가 정말 필요한 경우 외엔 차라리 RAG 같은 방식도 고려해볼 만합니다.
조용한엔지니어
데이터 전처리가 진짜 90% 일인 거 알면 충격이더라고요 ㅋㅋ
코드리뷰어
제 경험상 7,000개면 사실 파인튜닝이 애매한 규모거든요. 프롬프트 엔지니어링으로 먼저 최대한 뽑아낼 수 있을 때까지 해본 다음, 정말 일관되게 안 되는 부분만 따로 파인튜닝하는 게 효율적이었어요.
과적합은 보통 데이터가 충분하지 않거나 에폭이 너무 많을 때 나타나는데, 라벨링 기준이 흔들리면 더 심해진다더라고요. 팀원들이랑 예제 검토를 여러 번 하면서 기준을 확실히 잡는 게 핵심인 것 같습니다. 파인튜닝이 진짜 필요한 건 특정 포맷 출력이나 매우 전문적인 도메인 이해가 필요할 때네요.