2026.06.16 접속자 25
로그인 회원가입
HOT
[기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요? [기술 Q&A] LLM 토큰 길이 제한 때문에 답답한데 실무에선 어떻게 처리하세요? [AI뉴스] 요즘 오픈소스 LLM 수준이 진짜 미쳤네... 상용 모델과의 격차가 좁혀졌다고 봐야 나요? [AI뉴스] 앤트로픽 클로드 페이블 5 출시됐네요... 인간 전문가 수준이라고? [AI뉴스] 요즘 AI가 달라졌대요... 뭐가 계속 바뀌는 거죠? [프롬프트] 클로드한테 요구사항 정확하게 전달하는 프롬프트 팁 있나요? [프롬프트] 시장 분석할 때 쓰는 프롬프트 공유합니다 [기술 Q&A] LLM 파인튜닝할 때 토큰 수 줄이는 방법 뭐 하세요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA 말고 다른 방법 써보신 분? [AI뉴스] 국내 AI 기본법 시행됐는데 이게 실제로 뭐가 달라지는 건가요? [기술 Q&A] 최근에 RAG 구현해보신 분들 어떤 벡터DB 쓰세요?
GPT

데이터 전처리 프롬프트 이거 써보니 시간이 확 줄어들었어요

딥러닝장인 2026.05.19 01:28 조회 312 추천 14 댓글 2건
요즘 CSV 데이터 정제할 때 ChatGPT에 구체적인 포맷을 지정해서 던지는 방식을 써봤는데 정말 효율이 다르더라고요. "다음 데이터에서 NULL값은 평균으로 채우고, 이상치는 IQR 방식으로 제거해서 JSON으로 반환해줘"라는 식으로 명확하게 지시하니까 한 번에 맞는 결과가 나와요. 전에는 막연하게 "이 데이터 정리해줘"라고 물어봐서 여러 번 수정 요청했거든요.

코드 생성보다는 이렇게 구체적인 입출력 형식을 명시하는 게 핵심인 것 같습니다. 그리고 프롬프트에 예시 데이터 2~3개 정도 포함시키니까 더 정확해졌어요. 처음엔 약간의 오버헤드 같았는데, 반복 수정 시간을 생각하면 확실히 이득입니다.

혹시 비슷한 경험 있으신 분들 계신가요? 다른 분야에서는 어떻게 활용하고 계신지 궁금해요.
추천 14 비추천 0
댓글 2

댓글목록

profile_image
궁금하면
저도 비슷한 경험했는데 정말 차이가 크더라고요. 특히 입출력 포맷을 JSON이나 CSV처럼 구체적으로 명시하니까 데이터 타입 실수도 줄어들었어요. 예시 데이터 몇 개 주는 거 정말 중요한데, 저는 최근에 "이전에 처리한 데이터 예시처럼 해줘"라고 던지니까 일관성도 더 좋아졌습니다. 마크다운으로 테이블 형식 지정하는 것도 추천해요.
profile_image
현실주의자
저도 비슷하게 느껴요. 예시 데이터 넣는 게 정말 차이 나더라고요. 특히 복잡한 포맷 변환할 땐 거의 한 방에 나와요 ㅋㅋ