2026.05.02 접속자 45
로그인 회원가입
HOT
[AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [프롬프트] 업무 보고서 쓸 때 써먹는 프롬프트 공유합니다 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [프롬프트] 번역 작업할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 기술 발전 속도가 미친 수준인데, 따라가기가 힘드네요 [프롬프트] 긴 문서 분석할 때 프롬프트 어떻게 짜시나요? [AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [기술 Q&A] 요즘 LLM 컨텍스트 윈도우 경쟁이 좀 이상하지 않나요? [프롬프트] ChatGPT한테 같은 질문을 여러 번 해도 답변이 자꾸 달라지는데 이게 정상인가요? [AI뉴스] 요즘 LLM 너무 많이 나오는데 뭘 써야 하나요? [AI뉴스] 2026년 AI 산업 핵심은 큰 모델이 아니라 시스템 수준의 경쟁이네요 [프롬프트] 업무 보고서 쓸 때 써먹는 프롬프트 공유합니다 [AI뉴스] OpenAI, 14일에 GPT-6 출시... 이번엔 진짜 달라질까 [프롬프트] 번역 작업할 때 쓰는 프롬프트 공유합니다 [AI뉴스] 요즘 AI 기술 발전 속도가 미친 수준인데, 따라가기가 힘드네요 [프롬프트] 긴 문서 분석할 때 프롬프트 어떻게 짜시나요? [AI뉴스] 2026년 AI 산업, 에이전트 시대와 피지컬 AI가 본격화되는 중 [기술 Q&A] 요즘 LLM 컨텍스트 윈도우 경쟁이 좀 이상하지 않나요? [프롬프트] ChatGPT한테 같은 질문을 여러 번 해도 답변이 자꾸 달라지는데 이게 정상인가요?
프롬프트

프롬프트 엔지니어링으로 LLM 정확도 올려보신 분?

흐름타는개발자 2026.04.18 08:53 조회 54 추천 11 댓글 2건
최근에 GPT-4 API로 텍스트 분류 작업을 하고 있는데, 처음엔 간단하게 "이 텍스트를 분류해줘" 정도로 던졌더니 정확도가 70% 정도였어요. 그런데 프롬프트를 다시 정리해서 few-shot 예제 몇 개 넣고, 분류 기준을 더 구체적으로 명시하니까 89%까지 올랐거든요.

특히 효과 본 부분은 "당신은 텍스트 분류 전문가입니다" 같은 롤 프롬프팅이랑 출력 포맷을 JSON으로 강제하는 거였어요. 근데 신기한 게 같은 입력이어도 온도나 max_tokens 값에 따라 결과가 좀 달라지더라고요.

혹시 여기서 더 개선할 수 있는 방법이 있을까요? 아니면 이 정도면 차라리 파인튜닝을 고려해봐야 하나 싶기도 하고요. 비용도 신경 쓰이고 ㅠㅠ
추천 11 비추천 0
댓글 2

댓글목록

profile_image
따뜻한코더
89%까지 올리셨다니 좋네요. 저도 비슷한 경험이 있는데, 프롬프트 튜닝으로 충분하면 파인튜닝까지 갈 필요는 없을 것 같아요. 다만 더 개선하려면 few-shot 예제를 현재 분류 애매한 케이스들로 추가해보시고, Chain of Thought 패턴도 한번 시도해볼 만해요. 온도는 분류 작업이면 0.1 정도로 낮추는 게 일관성 있더라고요.
profile_image
AI새싹
저도 비슷한 경험이 있는데, 89%까지 올리셨으면 파인튜닝까진 필요 없을 것 같네요. 대신 chain-of-thought 프롬프팅을 시도해보셨나요? 모델이 단계별로 분석하게 하니까 정확도가 더 올랐거든요. 온도는 분류 같은 작업이면 0.3 이하로 낮추는 게 일반적이더라고요.