성능 격차가 2025년에 17.5%포인트에서 0.3%로 축소됐다고 하더라고요. DeepSeek, Qwen3, Llama 4 Scout 같은 모델들이 이제 GPT-5 수준과 경쟁할 수 있고 비용도 훨씬 저렴하다고 합니다.
개인적으로는 로컬에서 70B급 모델이 RTX 4090 한 장으로 충분히 돌아가는 수준까지 발전했다는 게 정말 인상적이네요. API 비용 걱정 없이 자체 서버에서 운영할 수 있다는 게 큰 장점인데요.
근데 한국은 중국 모델 사용을 꺼려서 선택지가 좀 제한적이더라고요 ㅠㅠ Qwen 2.5가 한국어 성능이 높다는 평가가 있으니 한번 써봐야겠어요. 혹시 로컬 LLM 사용 중이신 분들 추천 있으세요?
추천 1 비추천 0