2026.07.17 접속자 54명

로그인 | 회원가입 | AI 서비스

HOT

[AI뉴스] 요즘 AI 기업들 뭐 하는지 봤어요? 삼성부터 구글까지 정신없네 [프롬프트] Claude한테 좋은 결과 뽑아낼 프롬프트 팁 있으신가요? [자유게시판] 집에서 라면 끓일 때 스프 양 조절하는 팁 공유 [AI뉴스] GPT-5.6 드디어 풀렸네요, 그리고 요즘 AI 흐름 정리해봤어요 [AI뉴스] 한국 AI 기본법 벌써 시행됐는데 워터마크 표시 의무까지... 요즘 AI 만드는 회사들 뭐 해야 하나요? [자유게시판] 편의점 야근 알바 3개월 후기, 이게 돈이 될까요? [자유게시판] 편의점 핫산 이용하면서 느낀 점들 [AI뉴스] AI 기본법 이제 진짜 시작됐더라고요... 계도기간 1년 뿐이라던데 [자유게시판] 편의점 계란말이 브랜드별로 맛이 이렇게 다르네요 [프롬프트] 프롬프트에 "역할 부여"를 넣으니까 확실히 달라지네요 [AI뉴스] 요즘 AI 기업들 뭐 하는지 봤어요? 삼성부터 구글까지 정신없네 [프롬프트] Claude한테 좋은 결과 뽑아낼 프롬프트 팁 있으신가요? [자유게시판] 집에서 라면 끓일 때 스프 양 조절하는 팁 공유 [AI뉴스] GPT-5.6 드디어 풀렸네요, 그리고 요즘 AI 흐름 정리해봤어요 [AI뉴스] 한국 AI 기본법 벌써 시행됐는데 워터마크 표시 의무까지... 요즘 AI 만드는 회사들 뭐 해야 하나요? [자유게시판] 편의점 야근 알바 3개월 후기, 이게 돈이 될까요? [자유게시판] 편의점 핫산 이용하면서 느낀 점들 [AI뉴스] AI 기본법 이제 진짜 시작됐더라고요... 계도기간 1년 뿐이라던데 [자유게시판] 편의점 계란말이 브랜드별로 맛이 이렇게 다르네요 [프롬프트] 프롬프트에 "역할 부여"를 넣으니까 확실히 달라지네요

목록

API연동

LLM 파인튜닝할 때 토큰 길이 제한 문제 어떻게 해결하세요?

현실주의자 2026.06.01 18:15 조회 133 추천 13 댓글 1건

요즘 자사 데이터로 오픈소스 모델(라마2)을 파인튜닝 중인데, 학습 데이터 중 일부가 컨텍스트 윈도우(4k 토큰)를 초과하더라고요. 단순히 자르자니 정보 손실이 생길까봐 걱정이고, 그렇다고 더 큰 모델로 가자니 비용이 장난 아니네요.

혹시 이런 상황에서 효과적인 방법 써보신 분 계신가요? 슬라이딩 윈도우로 오버래핑하게 하거나, 요약을 거쳐서 넣는 방식도 고민 중인데 실제로 써본 결과가 어떨지 궁금합니다. 아니면 처음부터 데이터 전처리를 다르게 해야 하는 건지.

추천 13 비추천 0

이전글RAG 시스템 구축할 때 청킹 방식 뭐 쓰세요?26.06.02
다음글LLM 파인튜닝할 때 토큰 길이 제한 어떻게 처리하세요?26.06.01

댓글 1

댓글목록

조용한엔지니어

26-07-12 19:54

저도 비슷한 문제 겪었는데 결국 청킹 방식을 섞어서 했어요. 긴 문서는 의미 있는 단락 단위로 나눠서 각각을 학습 샘플로 만들고, 문맥이 필요한 부분만 이전 청크와 오버래핑하게 했거든요. 단순 자르기보다는 효과가 훨씬 낫더라고요.
요약 방식은 솔직히 정보 손실 때문에 주의가 필요한데, 요약 자체가 LLM을 거쳐야 하니까 추가 비용도 들고요. 차라리 구조화된 청킹이 낫다고 봅니다.