2026.07.01 접속자 34
로그인 회원가입
HOT
[AI뉴스] 최근 딥러닝 논문들 보니 패러다임이 확실히 바뀌는군요 [프롬프트] 프롬프트 길게 써야 결과가 좋은 건가요? [AI뉴스] 2026년 AI 소식, 이제 에이전트 시대네요... 생성형 AI는 좀 낡은 얘기가 됐다고 해요 [AI뉴스] 요즘 AI 스타트업 투자 정말 다르네요... 돈은 막 나오는데 정상인가요? [프롬프트] 업무 자동화 프롬프트 어떻게 만드세요? [AI뉴스] 요즘 LLM 모델 출시 진짜 미친 수준인데... Llama 4, Gemini 3 써본 사람 있나요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 업데이트 소식 정리했어요 [자유게시판] 회사 휴게실 냉장고 물건 함부로 먹는 거 어떻게 해야 할까요? [프롬프트] 프롬프트 엔지니어링도 결국 대화 스킬이 아닐까요 [프롬프트] 데이터 분석 프롬프트 어떻게 쓰시나요? [AI뉴스] 최근 딥러닝 논문들 보니 패러다임이 확실히 바뀌는군요 [프롬프트] 프롬프트 길게 써야 결과가 좋은 건가요? [AI뉴스] 2026년 AI 소식, 이제 에이전트 시대네요... 생성형 AI는 좀 낡은 얘기가 됐다고 해요 [AI뉴스] 요즘 AI 스타트업 투자 정말 다르네요... 돈은 막 나오는데 정상인가요? [프롬프트] 업무 자동화 프롬프트 어떻게 만드세요? [AI뉴스] 요즘 LLM 모델 출시 진짜 미친 수준인데... Llama 4, Gemini 3 써본 사람 있나요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 업데이트 소식 정리했어요 [자유게시판] 회사 휴게실 냉장고 물건 함부로 먹는 거 어떻게 해야 할까요? [프롬프트] 프롬프트 엔지니어링도 결국 대화 스킬이 아닐까요 [프롬프트] 데이터 분석 프롬프트 어떻게 쓰시나요?
API연동

LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?

GPT덕후하나 2026.07.01 20:11 조회 1 추천 0 댓글 0건
요즘 자체 데이터로 LLM 파인튜닝을 시도하고 있는데, 학습 데이터 중에 토큰 길이가 4096을 넘는 샘플들이 꽤 많아요. 단순히 자르기만 하면 정보 손실이 심할 것 같은데 다들 어떻게 처리하시나요?

지금 생각하는 방법은 긴 문맥을 청킹해서 별도로 처리하거나, 아니면 그냥 max_length 설정해서 자르는 건데, 둘 다 좀 찝찝하네요. 혹시 더 좋은 방법이 있으면 알려주세요.

참고로 Llama 2 기반으로 작업 중이고 가용 VRAM이 24GB 정도입니다.
추천 0 비추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!