2026년 5월 허깅페이스에 올라온 Sulphur 2라는 비디오 생성 모델이 한 달 만에 53만 건 이상 다운로드되었다고 하더라고요. 로컬 환경에서 실행 가능한 오픈소스 영상 생성 모델인데 NSFW나 과격 표현 제한이 거의 없고, 텍스트나 이미지 기반으로 10초 분량 영상을 직접 생성할 수 있대요. 일부 사용자들은 미세 표정, 카메라 움직임, 분위기 표현 같은 부분이 기존 상용 모델보다 더 자연스럽다고 평가하고 있어요 ㅋㅋ
개인적으로는 뭔가 신기한 게, 커뮤니티가 만든 모델이 상용 모델 품질을 따라잡는다는 거예요. 물론 저작권, 딥페이크, 유해 콘텐츠 같은 문제도 함께 따라온다는 건 좀 걱정되긴 합니다. 하지만 이제 AI가 개인 GPU 위에서 완전히 통제 불가능한 방향으로도 빠르게 퍼지고 있다는 게 현실이네요.
언어 모델 쪽도 비슷합니다. 70B급 모델이 RTX 4090 한 장으로 양자화 구동 가능한 수준까지 발전했고, 한국어 성능도 상용 모델에 근접했다고 하더라고요. Meta가 공개한 Llama 3.3 70B는 GPT-4o 클래스 성능을 4-bit 양자화 시 RTX 4090 1장(24GB)+RAM 오프로드로 돌릴 수 있다는 게 진짜 개인적으로는 충격이었어요. 그리고