2026년이 오픈소스 LLM이 경쟁력을 갖춘 해라고 봐도 될 정도네요. Meta, Google, Mistral이 거의 동시에 발표한 최신 모델들이 상용 모델과의 간격을 완전히 좁혔다고 하더라고요. 솔직히 몇 개월 전만 해도 상용 모델 써야 한다는 느낌이었는데 이제는 선택의 폭이 많아졌다는 게 신선하네요.
Meta의 Llama 4는 두 가지 주요 변형으로 출시됐다고 하고, RTX 4090 한 장으로 GPT-4o 클래스 성능을 돌릴 수 있다고 해요. 개인적으로 가장 충격받은 부분이 여긴데, 이게 가능하다니 정말 대단한 거 같아요.
로컬 LLM도 70B급 모델이 RTX 4090 한 장으로 양자화 구동 가능할 정도로 발전했다고 하니까 진짜 앞으로 개인 개발자나 작은 팀들도 충분히 고급 모델을 쓸 수 있겠네요. 클라우드 API 요금 걱정 없이 자유롭게 실험할 수 있다는 게 강점인 것 같아요.
다만 이제 단일한 '절대 강자' 모델로 수렴하지 않는다고 봐요. OpenAI, Google, Anthropic 사이에서 모델 리더십이 계속 이동 중이고, Google의 Gemini 3 Pro가 종합 성능에서 강점을 보이고 있으면서 Claude 모델이 코딩 특화 작업에서 우위를 보이고 있대요.
결국 목적에 맞게 여러 모델을 조합해서 써야 하는 시대가 온 것 같은데... 다들 어떤 모델 조합으로 쓰고 계신가요? 특히 한국어 처리