2026.07.15 접속자 31명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 요즘 AI 기업들 뭐 하는지 봤어요? 삼성부터 구글까지 정신없네 [자유게시판] 요즘 편의점 계절 신상 많던데 뭐가 괜찮더라고요 [자유게시판] 편의점 야식을 계속 사먹다니 이게 뭐 하는 짓이냐 [자유게시판] 편의점 야시간 알바 2주 후기 [프롬프트] 마케팅 복사문 작성할 때 쓰는 프롬프트 공유해요 [자유게시판] 편의점 알바 3개월 해본 솔직한 후기 [프롬프트] 코드 생성할 때 프롬프트 구조 어떻게 짜세요? [자유게시판] 직장 다니면서 운동 어떻게 하세요? [AI뉴스] GPT-5.6 드디어 풀렸네요, 그리고 요즘 AI 흐름 정리해봤어요 [AI뉴스] 한국 AI 기본법 벌써 시행됐는데 워터마크 표시 의무까지... 요즘 AI 만드는 회사들 뭐 해야 하나요? [AI뉴스] 요즘 AI 기업들 뭐 하는지 봤어요? 삼성부터 구글까지 정신없네 [자유게시판] 요즘 편의점 계절 신상 많던데 뭐가 괜찮더라고요 [자유게시판] 편의점 야식을 계속 사먹다니 이게 뭐 하는 짓이냐 [자유게시판] 편의점 야시간 알바 2주 후기 [프롬프트] 마케팅 복사문 작성할 때 쓰는 프롬프트 공유해요 [자유게시판] 편의점 알바 3개월 해본 솔직한 후기 [프롬프트] 코드 생성할 때 프롬프트 구조 어떻게 짜세요? [자유게시판] 직장 다니면서 운동 어떻게 하세요? [AI뉴스] GPT-5.6 드디어 풀렸네요, 그리고 요즘 AI 흐름 정리해봤어요 [AI뉴스] 한국 AI 기본법 벌써 시행됐는데 워터마크 표시 의무까지... 요즘 AI 만드는 회사들 뭐 해야 하나요?

목록

API연동

LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?

인공지능개그맨 2026.05.19 19:47 조회 158 추천 14 댓글 2건

요즘 특정 도메인용으로 모델 파인튜닝을 시도 중인데, 학습 데이터 중에 토큰 길이가 4096을 넘는 문서들이 꽤 많거든요. 단순하게 자르면 정보 손실이 생길 것 같은데 이럴 때 보통 어떻게 처리하시나요?

지금까진 문서를 의미 단위로 chunk 하고 sliding window 방식으로 겹쳐서 학습시켜봤는데 성능이 기대보다 별로네요. 혹시 더 나은 방법이 있을까요? 아니면 처음부터 더 긴 context window 가진 모델로 가는 게 맞을까요?

같은 문제로 고민하신 분들의 경험담이나 팁 있으면 공유 부탁드립니다.

추천 14 비추천 0

이전글RAG 시스템 구축했는데 검색 정확도가 생각보다 낮네요26.05.20
다음글로컬 LLM 써보신 분들, 실제로 쓸만한 수준인가요?26.05.19

댓글 2

댓글목록

딥러닝장인

26-05-23 16:39

sliding window로 겹치는 방식도 좋은 시도인데 저도 비슷한 문제로 고민했어요. 제 경험상 chunk 경계에서 맥락이 끊기는 게 성능 저하의 원인인 경우가 많더라고요.
해결책으로는 몇 가지 시도해볼 만한데, 첫째는 context window가 더 긴 모델 쓰는 거고요. Claude 같은 경우 200k 토큰까지 지원하니까 그걸 고려해볼 만합니다. 비용은 좀 올라가지만요.
둘째는 hierarchical 방식인데, 긴 문서를 먼저 요약하고 요약본과 원본을 함께 학습하는 거예요. 이렇게 하면 전체 맥락을 보존하면서도 토큰 수를 줄일 수 있습니다.
셋째는 retrieval-augmented 접근인

궁금하면

26-06-23 15:55

저도 비슷한 문제 겪었는데 hierarchical chunking 시도해봤어요. 문서 구조를 살려서 단위별로 자르니까 sliding window보다 맥락이 덜 끊기더라고요. 긴 컨텍스트 모델로 가는 것도 좋지만 비용이 만만치 않으니까 이 방법부터 한번 시도해보시는 걸 추천합니다.