구글이 역대급으로 똑똑한 오픈소스 모델인 젬마 4를 공개했다더라고요. 가장 놀라운 건 성능인데 자기보다 20배나 덩치가 큰 모델들까지 가볍게 눌렀다고 합니다. 더 좋은 건 상업적 목적으로도 쓸 수 있게 허용했고 제약 없이 자신만의 특별한 서비스를 만들 수 있다는 거네요.
한편 알리바바도 최근에 좋은 모델을 내놨는데 약 30억개의 매개변수만 연산에 사용하는 희소 전문가 혼합(MoE) 구조를 적용한 오픈소스 AI 모델을 출시했다고 해요. 압도적인 효율성이 가장 큰 특징으로, 전체 매개변수 규모는 대형 모델 수준이지만 실제 계산에 사용되는 매개변수는 일부에 불과하다는 거예요 ㅋㅋ
결국 요즘 오픈소스 진영이 이렇게 강해지니까 개인 개발자도 고성능 AI를 충분히 활용할 수 있는 시대가 온 거 같아요. 비용 부담도 훨씬 덜하고 자유도도 높으니까요.
젬마4 진짜 괜찮더라고요. 파인튜닝도 잘 먹히고 로컬에서 도는 거 치고는 응답도 자연스러운 편이네요. 오픈소스 진영이 정말 빠르게 따라가고 있어요.
요정
젬마4 진짜 미쳤더라고요 ㅋㅋ 로컬에서 돌릴 수 있는 수준의 성능이 나왔다니 신기하네요
오늘도살자
젬마4는 확실히 성능 대비 효율이 좋긴 한데, 실제 상용화 관점에서는 아직 갈 길이 멀더라고요. 특히 한국어 처리 부분에서 미진하고, 파인튜닝 비용도 생각보다 만만찮아요. 알리바바 큐원의 MoE 구조는 흥미롭긴 한데 정말 그 효율을 실무에서 체감할 수 있을지는 좀 회의적입니다. 어쨌간 오픈소스 진영이 강해지는 건 맞지만, 결국 대규모 서비스 구축엔 프로프라이터리 모델이 여전히 주도권 가질 것 같아요.
따뜻한코더
젬마4 진짜 그렇게 좋아요? 한번 직접 써봐야겠네요 ㅋㅋ
오늘도살자
젬마 4 진짜 미친 성능이네요 ㅋㅋ
딥러닝장인
젬마4 진짜 성능 미친 것 같아요. 20배 큰 모델 누른다는 게 어떻게 가능한지 신기하더라고요. 개인 프로젝트에 바로 써볼 수 있다니 좋네요 ㅋㅋ
조용한엔지니어
젬마 4 진짜 놀랍더라고요. 20배 큰 모델 이기는 건 과장 아닌가 싶었는데 벤치마크 보니까 사실이네요. 상업용 허용이 가장 큰 포인트인 것 같아요. 이제 개인 개발자도 자기 서비스에 맞게 커스텀할 수 있으니까요.
알리바바 큐원의 MoE 구조도 신선한데, 요즘 이런 효율성 중심 설계가 트렌드가 되는 거 같습니다. 실제로 로컬에서 돌려볼 수 있는 옵션이 많아지니 누가 클라우드 API 계속 써야 하나 싶네요 ㅋㅋ
오늘도살자
젬마 4는 확실히 임팩트 있긴 한데, 성능 벤치마크를 직접 보니까 과장된 부분도 좀 있더라고요. 특정 데이터셋에서는 잘하지만 실무에서 쓰면 생각보다 아닐 수 있다는 게 함정이거든요.
알리바바 큐원 MoE 구조는 효율성 면에서 정말 흥미로운데, 실제로 온디바이스 배포할 때 메모리 효율이 얼마나 좋은지가 관건일 것 같아요. 이론상으로는 멋진데 실제 구현에서 지연시간이 나올 수 있으니까요.