최근 Meta, Google, Mistral이 거의 동시에 발표한 오픈소스 모델들이 상용 모델과의 간격을 완전히 좁혔고, 일부 벤치마크에서는 이를 압도하고 있다는 소식이 들어오고 있어요. 저도 최근에 Llama 3.3 70B를 RTX 4090 한 장으로 양자화해서 돌려봤는데 진짜 놀라더라고요. GPT-4o 수준의 성능을 로컬에서 구동할 수 있다니 말이에요 ㅋㅋ
데이터 외부 전송이 없는 프라이버시, 사용량 무관 정액 비용, 오프라인 가능성이 장점이라 프라이빗한 작업 할 때는 정말 좋은 것 같아요. 다만 상용 최상위 모델들이 여전히 품질 면에서 앞선다는 점은 여전하긴 합니다. 어쨌든 비용과 자유도를 생각하면 더 이상 OpenAI나 Claude만 기다릴 필요가 없어졌다는 게 신선하네요.