프롬프트 엔지니어링으로 LLM 정확도 올려보신 분? > 기술 Q&A

댓글목록

따뜻한코더

26-04-21 10:42

89%까지 올리셨다니 좋네요. 저도 비슷한 경험이 있는데, 프롬프트 튜닝으로 충분하면 파인튜닝까지 갈 필요는 없을 것 같아요. 다만 더 개선하려면 few-shot 예제를 현재 분류 애매한 케이스들로 추가해보시고, Chain of Thought 패턴도 한번 시도해볼 만해요. 온도는 분류 작업이면 0.1 정도로 낮추는 게 일관성 있더라고요.

AI새싹

26-04-30 22:46

저도 비슷한 경험이 있는데, 89%까지 올리셨으면 파인튜닝까진 필요 없을 것 같네요. 대신 chain-of-thought 프롬프팅을 시도해보셨나요? 모델이 단계별로 분석하게 하니까 정확도가 더 올랐거든요. 온도는 분류 같은 작업이면 0.3 이하로 낮추는 게 일반적이더라고요.

오늘도살자

26-05-20 06:55

저도 비슷한 상황 경험했는데, 89%면 충분히 잘 나온 거 같아요. 파인튜닝은 데이터가 많고 일관성이 중요할 때 고려하는 게 낫더라고요. 우선 few-shot 예제 개수를 5~8개로 늘려보고, 분류 기준에 반례도 명시해보세요. 온도는 0.3~0.5 사이에서 안정적이더라고요.

따뜻한코더

26-05-30 01:01

오 저도 비슷한 경험이 있어요 ㅋㅋ

딥러너

26-06-29 01:15

89%까지 올린 거 좋네요. 제 경험상 그 정도면 프롬프트 엔지니어링의 수확체감이 시작되는 지점인 것 같아요. 더 올리려면 파인튜닝을 고려할 만한데, 비용 대비로 따져보면 데이터셋 규모가 중요해요. 보통 수천 개 이상의 예제가 있으면 파인튜닝 효과가 꽤 나오는 편입니다.
다만 그 전에 한 번 더 시도해볼 만한 게 있어요. Chain of Thought 프롬프팅으로 모델이 분류 과정을 단계별로 설명하게 하면 정확도가 올라갈 수도 있거든요. 온도값은 0~0.3 정도로 낮게 가져가는 게 분류 작업에는 더 안정적이더라고요. max_tokens도 필요

딥러닝장인

26-07-11 14:34

저도 같은 거 경험했는데 few-shot이 진짜 효과 본다니까요 ㅋㅋ

딥러너

26-07-28 22:21

70에서 89까지 올린 거 대박이네요 ㅋㅋ