구글이 역대급으로 똑똑한 오픈소스 모델인 젬마 4를 공개했다더라고요. 가장 놀라운 건 성능인데 자기보다 20배나 덩치가 큰 모델들까지 가볍게 눌렀다고 합니다. 더 좋은 건 상업적 목적으로도 쓸 수 있게 허용했고 제약 없이 자신만의 특별한 서비스를 만들 수 있다는 거네요.
한편 알리바바도 최근에 좋은 모델을 내놨는데 약 30억개의 매개변수만 연산에 사용하는 희소 전문가 혼합(MoE) 구조를 적용한 오픈소스 AI 모델을 출시했다고 해요. 압도적인 효율성이 가장 큰 특징으로, 전체 매개변수 규모는 대형 모델 수준이지만 실제 계산에 사용되는 매개변수는 일부에 불과하다는 거예요 ㅋㅋ
결국 요즘 오픈소스 진영이 이렇게 강해지니까 개인 개발자도 고성능 AI를 충분히 활용할 수 있는 시대가 온 거 같아요. 비용 부담도 훨씬 덜하고 자유도도 높으니까요.
젬마4 진짜 괜찮더라고요. 파인튜닝도 잘 먹히고 로컬에서 도는 거 치고는 응답도 자연스러운 편이네요. 오픈소스 진영이 정말 빠르게 따라가고 있어요.
요정
젬마4 진짜 미쳤더라고요 ㅋㅋ 로컬에서 돌릴 수 있는 수준의 성능이 나왔다니 신기하네요
오늘도살자
젬마4는 확실히 성능 대비 효율이 좋긴 한데, 실제 상용화 관점에서는 아직 갈 길이 멀더라고요. 특히 한국어 처리 부분에서 미진하고, 파인튜닝 비용도 생각보다 만만찮아요. 알리바바 큐원의 MoE 구조는 흥미롭긴 한데 정말 그 효율을 실무에서 체감할 수 있을지는 좀 회의적입니다. 어쨌간 오픈소스 진영이 강해지는 건 맞지만, 결국 대규모 서비스 구축엔 프로프라이터리 모델이 여전히 주도권 가질 것 같아요.