오픈소스와 독점 AI 모델 간의 성능 격차가 2025년 주요 벤치마크에서 17.5%포인트에서 단 0.3%로 축소되었다고 하네요. 진짜 충격적이지 않나요? 몇 개월 전만 해도 클로드나 GPT-4 쓸 때가 갈려 있다고 생각했는데, 이제는 오픈소스만 가지고도 거의 같은 수준의 결과를 얻을 수 있다는 거더라고요.
특히 최근 나온 모델들이 정말 좋아요. 구글이 역대 가장 지능적인 오픈소스 모델인 '젬마 4(Gemma 4)'를 2일(현지시간) 공개했고, DeepSeek V3.2, Qwen3-235B, Llama 4 Scout는 이제 GPT-5.2 및 Claude Opus 4.5와 비용의 일부로 경쟁한다니까요. 비용까지 싼데 성능은 비슷하다는 게 정말 마크다운 아닌가 싶어요.
미스트랄 라지 3와 3가지 소형 밀집 모델(14B, 8B, 3B)이 아파치 2.0 라이선스로 제공돼 개발자 커뮤니티의 자유로운 활용이 가능하다고 하니까, 이제는 정말 클라우드 API 서비스에 종속될 필요가 없을 것 같아요. 우리 회사도 지금까지는 OpenAI API 월 몇백 달러 내면서 썼는데, 혹시 이런 오픈소스 모델로 갈아타도 괜찮을까 싶은 생각까지 들어요.
다만 한 가지 고민이 생겼어요. 성능은 좋은데 실제 업프로덕션 환경에서 쓸 때 유지보수 비용이나 인프라 셋업 과정은 어떻게 되는지 궁금하네요. 혹시 이런 오픈소스 모델 써보신 분 계신가요? 실제로 도입했을 때