2026.06.22 접속자 32
로그인 회원가입
HOT
[프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [AI뉴스] 국내 AI 기업 차세대 반도체 경쟁 시작된 듯... 리벨리온, 퓨리오사 뭐가 어떤 건지 정리해주실 분? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [AI뉴스] 요즘 AI 기업들 뭐하는지 봤어요? [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [AI뉴스] 국내 AI 기업 차세대 반도체 경쟁 시작된 듯... 리벨리온, 퓨리오사 뭐가 어떤 건지 정리해주실 분? [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [AI뉴스] 요즘 AI 기업들 뭐하는지 봤어요? [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요
오류해결

LLM 파인튜닝할 때 데이터 품질 vs 량 뭐가 더 중요한가요?

AI새싹 2026.06.18 13:02 조회 26 추천 3 댓글 1건
요즘 회사에서 소규모 LLM 파인튜닝 프로젝트를 진행 중인데 의견이 좀 엇갈리거든요. 팀장님은 고품질 데이터 5천 개로 시작하자고 하시고, 인턴분은 그냥 자동화로 5만 개 모아서 노이즈 처리하는 게 낫다고 주장하네요.

저는 직관적으로 품질이 중요할 것 같은데 실제로 해본 분들은 어떠신가요? 특히 금융 도메인인데 정확도가 중요한 상황이라 더 신경 쓰입니다. 둘 다 시도해본 경험이 있으면 어떤 차이가 있었는지 궁금합니다.
추천 3 비추천 0
댓글 1

댓글목록

profile_image
인공지능개그맨
금융은 확실히 품질이 우선이어야 할 것 같아요. 저도 비슷한 프로젝트 했는데 5만 개 노이즈 섞인 데이터보다 5천 개 깔끔한 데이터가 validation 성능이 훨씬 좋더라고요. 특히 금융처럼 오류 하나가 큰 도메인은 더욱 그렇고요.
차라리 먼저 5천 개로 베이스라인 잡고 필요한 부분만 조금씩 추가하는 게 나을 것 같습니다. 자동화 데이터는 나중에 증강용으로 쓰셔도 늦지 않으니까요.