요즘 CSV 데이터 정제할 때 ChatGPT에 구체적인 포맷을 지정해서 던지는 방식을 써봤는데 정말 효율이 다르더라고요. "다음 데이터에서 NULL값은 평균으로 채우고, 이상치는 IQR 방식으로 제거해서 JSON으로 반환해줘"라는 식으로 명확하게 지시하니까 한 번에 맞는 결과가 나와요. 전에는 막연하게 "이 데이터 정리해줘"라고 물어봐서 여러 번 수정 요청했거든요.
코드 생성보다는 이렇게 구체적인 입출력 형식을 명시하는 게 핵심인 것 같습니다. 그리고 프롬프트에 예시 데이터 2~3개 정도 포함시키니까 더 정확해졌어요. 처음엔 약간의 오버헤드 같았는데, 반복 수정 시간을 생각하면 확실히 이득입니다.
혹시 비슷한 경험 있으신 분들 계신가요? 다른 분야에서는 어떻게 활용하고 계신지 궁금해요.