요즘 오픈소스 AI 모델들이 미쳤네요... 구글 젬마4, 알리바바 큐원 근황 > AI 뉴스

댓글목록

딥러닝장인

26-05-02 22:16

젬마4 진짜 괜찮더라고요. 파인튜닝도 잘 먹히고 로컬에서 도는 거 치고는 응답도 자연스러운 편이네요. 오픈소스 진영이 정말 빠르게 따라가고 있어요.

요정

26-05-05 12:29

젬마4 진짜 미쳤더라고요 ㅋㅋ 로컬에서 돌릴 수 있는 수준의 성능이 나왔다니 신기하네요

오늘도살자

26-05-05 18:50

젬마4는 확실히 성능 대비 효율이 좋긴 한데, 실제 상용화 관점에서는 아직 갈 길이 멀더라고요. 특히 한국어 처리 부분에서 미진하고, 파인튜닝 비용도 생각보다 만만찮아요. 알리바바 큐원의 MoE 구조는 흥미롭긴 한데 정말 그 효율을 실무에서 체감할 수 있을지는 좀 회의적입니다. 어쨌간 오픈소스 진영이 강해지는 건 맞지만, 결국 대규모 서비스 구축엔 프로프라이터리 모델이 여전히 주도권 가질 것 같아요.

따뜻한코더

26-05-07 13:03

젬마4 진짜 그렇게 좋아요? 한번 직접 써봐야겠네요 ㅋㅋ

오늘도살자

26-05-13 12:46

젬마 4 진짜 미친 성능이네요 ㅋㅋ

딥러닝장인

26-05-18 15:55

젬마4 진짜 성능 미친 것 같아요. 20배 큰 모델 누른다는 게 어떻게 가능한지 신기하더라고요. 개인 프로젝트에 바로 써볼 수 있다니 좋네요 ㅋㅋ

조용한엔지니어

26-05-28 05:23

젬마 4 진짜 놀랍더라고요. 20배 큰 모델 이기는 건 과장 아닌가 싶었는데 벤치마크 보니까 사실이네요. 상업용 허용이 가장 큰 포인트인 것 같아요. 이제 개인 개발자도 자기 서비스에 맞게 커스텀할 수 있으니까요.
알리바바 큐원의 MoE 구조도 신선한데, 요즘 이런 효율성 중심 설계가 트렌드가 되는 거 같습니다. 실제로 로컬에서 돌려볼 수 있는 옵션이 많아지니 누가 클라우드 API 계속 써야 하나 싶네요 ㅋㅋ

오늘도살자

26-06-02 12:03

젬마 4는 확실히 임팩트 있긴 한데, 성능 벤치마크를 직접 보니까 과장된 부분도 좀 있더라고요. 특정 데이터셋에서는 잘하지만 실무에서 쓰면 생각보다 아닐 수 있다는 게 함정이거든요.
알리바바 큐원 MoE 구조는 효율성 면에서 정말 흥미로운데, 실제로 온디바이스 배포할 때 메모리 효율이 얼마나 좋은지가 관건일 것 같아요. 이론상으로는 멋진데 실제 구현에서 지연시간이 나올 수 있으니까요.