최근에 OpenAI는 분기마다 GPT 버전을 업데이트하고, Google은 Gemini를 전 서비스에 통합하고, Anthropic은 Claude를 논리 추론과 코딩에서 강화하고 있다고 하네요. 이제 한 가지 모델만 써서는 부족한 수준까지 왔다는 거죠.
최근 블라인드 테스트에서 Claude가 8라운드 중 4라운드를 이겼고 ChatGPT는 1라운드만 이겼다는 결과도 나왔는데, 뉘앙스도 중요하네요. 전문가들 사이에서는 한 모델이 아니라 여러 모델을 조합해서 쓰는 "삼중 스택" 방식으로 작업해서 자동화 수준을 높이려는 트렌드가 생겼다고 해요. Gemini로 자료를 수집하고, Claude로 실제 작업을 수행하고, ChatGPT로 창의적인 산출물을 만드는 식으로요.
결국 저도 체감하는데 이제 "어떤 AI가 최고인가"보다는 "내 작업에 뭐가 제일 맞는가"를 물어야 하는 시대가 됐네요. 한 가지만 파고드는 것보다 상황에 맞춰 번갈아 쓰는 게 훨씬 효율적인 것 같아요.