OpenAI가 4월 14일 GPT-6를 출시했다고 했는데, 코딩과 추론 성능이 전 세대 대비 40% 이상 향상되고 HumanEval 점수가 95% 수준에 올라갔다더라고요. 가끔 헷갈린 결과 나오던 것도 hallucination 비율이 0.1% 이하로 떨어졌다고 하니까 좀 더 믿을 만해 보여요.
근데 문제는 Anthropic 클로드도 새 버전 나왔고, Google은 Gemma 4를 공개했으며, 중국 모델들까지 우후죽순 출시되고 있다는 거거든요 ㅋㅋ. 이 많은 모델 중에 뭘 선택해야 하는지 너무 헷갈려요. 제 프로젝트는 코딩 작업이 많은데, 이 경우 어떤 모델이 좋을까요?