2026.05.14 접속자 65
로그인 회원가입
HOT
[AI뉴스] 요즘 뜨는 LLM 모델들 정리해봤는데 너무 많네요 ㅋㅋ [AI뉴스] 요즘 AI 추세 정리해봤는데, 생성형 AI는 이미 과거라고? [프롬프트] 코드 리뷰할 때 쓸 만한 프롬프트 공유합니다 [프롬프트] Claude한테 좋은 결과 뽑아내는 프롬프트 팁 있으신가요? [AI뉴스] 한국 AI 기본법 시행 앞두고 국내외 규제 경쟁 심화되는 중 [AI뉴스] 요즘 AI 뉴스 보다 보니 정말 많이 변하는구나 싶네요 [자유게시판] 요즘 점심 뭐 먹으세요? [프롬프트] 코드 리뷰 프롬프트 어떻게 쓰세요? [자유게시판] 요즘 왜 다들 커피는 안 마시고 에너지 드링크만 마셔요? [자유게시판] 편의점 알바 3개월 해본 후기 및 꿀팁 공유 [AI뉴스] 요즘 뜨는 LLM 모델들 정리해봤는데 너무 많네요 ㅋㅋ [AI뉴스] 요즘 AI 추세 정리해봤는데, 생성형 AI는 이미 과거라고? [프롬프트] 코드 리뷰할 때 쓸 만한 프롬프트 공유합니다 [프롬프트] Claude한테 좋은 결과 뽑아내는 프롬프트 팁 있으신가요? [AI뉴스] 한국 AI 기본법 시행 앞두고 국내외 규제 경쟁 심화되는 중 [AI뉴스] 요즘 AI 뉴스 보다 보니 정말 많이 변하는구나 싶네요 [자유게시판] 요즘 점심 뭐 먹으세요? [프롬프트] 코드 리뷰 프롬프트 어떻게 쓰세요? [자유게시판] 요즘 왜 다들 커피는 안 마시고 에너지 드링크만 마셔요? [자유게시판] 편의점 알바 3개월 해본 후기 및 꿀팁 공유
활용법

LLM fine-tuning할 때 토큰 임베딩 층 고정하고 학습하면 효과가 별로인가요?

딥러닝장인 2026.05.12 06:31 조회 9 추천 1 댓글 0건
요즘 작은 모델로 특정 도메인 데이터셋으로 파인튜닝을 하고 있는데, 계산 비용 때문에 임베딩 층은 고정하고 트랜스포머 블록만 학습시켜봤거든요. 전체 파라미터를 학습할 때보다 성능이 눈에 띄게 떨어지더라고요.

혹시 이게 일반적인 현상인가요? 아니면 제 설정이나 데이터셋 문제일 가능성이 높나요. 기술적으로 임베딩만 고정해도 충분할 거라고 생각했는데 실제론 그렇지 않은 건가 싶기도 하고요.

혹시 비슷한 경험 있으신 분이나 이론적으로 설명해주실 분 계신가요?
추천 1 비추천 0
댓글 0

댓글목록

아직 댓글이 없습니다. 첫 댓글을 남겨보세요!