2026.06.24 접속자 8
로그인 회원가입
HOT
[프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요 [기술 Q&A] 로컬 LLM 처음 써봤는데 생각보다 쓸만하네요 [프롬프트] 코드 리뷰용 프롬프트 뭐 쓰세요? [프롬프트] 프롬프트 쓸 때 컨텍스트 먼저 주는 게 정말 효과 있더라고요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 쓸만한 수준까지 왔네요 [프롬프트] 코드 리뷰 프롬프트 어떻게 짜세요? 자꾸 피상적으로만 지적하네요 [AI뉴스] 우리나라도 AI 기본법 시행됐는데... 규제 대응이 이제 수출 경쟁력이네요 [프롬프트] 프롬프트 작성할 때 맥락(context) 어디까지 줘야 하나요? [프롬프트] 프롬프트 엔지니어링도 결국 "질문을 잘 하는 것"이더라고요 [AI뉴스] ChatGPT 시장점유율 50% 밑으로... 최근 AI 챗봇 업계 판 뒤집혔네요 [AI뉴스] 2026년 AI 트렌드, AI 에이전트가 대세더라고요 [기술 Q&A] 로컬 LLM 처음 써봤는데 생각보다 쓸만하네요
오류해결

LLM 파인튜닝할 때 데이터 품질 vs 량 뭐가 더 중요한가요?

AI새싹 2026.06.18 13:02 조회 35 추천 4 댓글 1건
요즘 회사에서 소규모 LLM 파인튜닝 프로젝트를 진행 중인데 의견이 좀 엇갈리거든요. 팀장님은 고품질 데이터 5천 개로 시작하자고 하시고, 인턴분은 그냥 자동화로 5만 개 모아서 노이즈 처리하는 게 낫다고 주장하네요.

저는 직관적으로 품질이 중요할 것 같은데 실제로 해본 분들은 어떠신가요? 특히 금융 도메인인데 정확도가 중요한 상황이라 더 신경 쓰입니다. 둘 다 시도해본 경험이 있으면 어떤 차이가 있었는지 궁금합니다.
추천 4 비추천 0
댓글 1

댓글목록

profile_image
인공지능개그맨
금융은 확실히 품질이 우선이어야 할 것 같아요. 저도 비슷한 프로젝트 했는데 5만 개 노이즈 섞인 데이터보다 5천 개 깔끔한 데이터가 validation 성능이 훨씬 좋더라고요. 특히 금융처럼 오류 하나가 큰 도메인은 더욱 그렇고요.
차라리 먼저 5천 개로 베이스라인 잡고 필요한 부분만 조금씩 추가하는 게 나을 것 같습니다. 자동화 데이터는 나중에 증강용으로 쓰셔도 늦지 않으니까요.