최근에 Claude랑 GPT-4 써보면서 같은 질문이어도 프롬프트를 어떻게 쓰냐에 따라 결과가 확 달라지는 거 느꼈거든요. 그래서 궁금한데 이게 진짜 프롬프트 엔지니어링의 효과인지 아니면 모델의 운(?)인지 판단이 안 서요.
특히 JSON 형식으로 답변받거나 Step-by-step으로 풀어달라고 할 때 정확도가 올라가는 것 같긴 한데, 이게 일관성 있는 개선인지 애매합니다. 혹시 이 부분에 대해 제대로 실험해보신 분 계신가요? 실제 업무나 프로젝트에서 어떤 식으로 프롬프트를 구성해서 효과 봤는지 궁금합니다.