요즘 미스트랄, 젬마, 디ープ씩 같은 오픈소스 모델들이 쏟아져 나오고 있어서 정리를 좀 해봤어요.
미스트랄이 라지 3와 소형 모델들(14B, 8B, 3B)을 아파치 2.0 라이선스로 출시했고, 구글도 젬마 4를 공개했다고 하네요. 오픈소스와 독점 모델 간의 성능 격차가 2025년 17.5%에서 단 0.3%로 축소됐다고 하니까 정말 대단한 진전이긴 한데요. DeepSeek V3.2, Qwen3, Llama 4 Scout는 이제 GPT-5.2 및 Claude Opus 4.5와 비용의 일부로 경쟁한다고 하더라고요.
개인적으로는 여기서 약간 냉소적인 관점을 떨칠 수가 없어요. 성능 격차가 줄었다는 건 사실이지만, 벤치마크와 실전은 다르거든요. 벤치마크에서 좋은 점수를 받는 거랑 실제 프로덕션 환경에서 안정적으로 돌아가는 건 전혀 다른 문제예요. 최적화, 안정성, 엔지니어링... 이런 부분들에서는 여전히 클로즈드 모델이 우위에 있다고 생각합니다.
그리고 비용 면에서 DeepSeek V3.2는 입력 100만 토큰당 $0.26, Mistral Medium 3는 $0.40이라고 하니까 가격은 정말 매력적이에요. 조직들이 오픈소스 접근 방식에서 25% 더 높은 ROI를 보고한다고까지 나왔으니까요. 근데 이게 대규모 엔터프라이즈 환경에서도 정말 유지될 수 있을지는 의문입니다.