구글이 4월에 공개한 젬마 4가 화제더라고요. 고급 추론과 에이전트 기반 워크플로우 위해 특수 설계된 모델이라면서 파라미터당 성능이 진짜 좋다고 하네요. 개인적으로는 지금까지 오픈소스 모델들이 좀 아쉬웠는데 이제 달라진다는 생각이 들어요.
4월에 나온 DeepSeek V4도 MIT 라이선스 오픈소스 모델인데 파라미터가 어마어마해요. Pro 버전은 1.6조 파라미터, Flash 버전도 2,840억 파라미터 규모라고 합니다. 이 정도면 상용 모델 안 써도 될 수준 아닌가 싶네요.
70B급 모델이 RTX 4090 한 장으로 양자화 구동 가능한 수준까지 발전했다고 하더라고요. 실제로 Meta의 Llama 3.3 70B는 GPT-4o 클래스 성능을 개인 GPU에서 돌릴 수 있다는 점에서 사실상 표준이라고 봐요.
문제는 너무 많은 선택지예요. 최고의 모델이 뭔지를 묻는 것보다 생태계가 특화된 도구들로 나뉘어 있다는 게 더 정확한 상황이라서 어떤 걸 골라야 할지 고민이 많아요. 코딩용으로는 DeepSeek-R1이 좋다네요. 한국어 자연스럽게 쓰려면 Qwen이 낫고요.
결국 상황에 맞게 모델을 찾아서 써야 하는 시대가 온 것 같습니다. 예전처럼 "이 모델이 제일 좋다"는 건 없어진 것 같고, 각자 필요한 걸로 커스터마이징해서 쓰는 게 트렌드인 듯해요.
추천 1 비추천 0