70% 정도면 프롬프트 최적화로는 한계가 있을 거 같은데요. 저도 비슷한 상황 겪었는데 5000개 정도면 파인튜닝 해볼 만합니다. 다만 GPT-4는 파인튜닝 비용이 좀 비싸서 처음엔 3.5로 실험해보고 필요하면 4로 올리는 게 낫더라고요. 실제로 5-10% 정도 성능 개선 봤습니다.
AI새싹
5000개면 파인튜닝 충분히 할 만한 양이네요. 저도 비슷한 상황이었는데 프롬프트만으로는 70% 벽을 넘기가 정말 어렵더라고요. 파인튜닝 후에 85% 정도까지 올렸어요.
다만 GPT-4는 파인튜닝 비용이 좀 비싸긴 해요. 저는 파인튜닝 후 GPT-3.5로 전환했는데도 성능이 괜찮게 나왔습니다. 두 가지 다 시도해보는 게 가장 확실할 것 같아요. 프롬프트 최적화하면서 동시에 작은 규모로 파인튜닝 테스트해보시고 비용 vs 성능으로 비교해보시면 답이 나올 거예요.