2026.06.20 접속자 40
로그인 회원가입
HOT
[AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요? [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA vs Full Fine-tuning 뭐가 낫나요? [AI뉴스] 요즘 ChatGPT, Claude, Gemini 중 뭘 쓰세요? [프롬프트] GPT한테 물어보는 방식 바꿨더니 답변이 완전 달라졌어요 [프롬프트] 실무에서 써먹는 프롬프트 팁 - 맥락 주기가 진짜 중요하더라고요 [AI뉴스] 요즘 AI 업계 움직임이 심심치 않네요... 최신 소식 정리해봤습니다 [AI뉴스] AI 에이전트가 핫한데 보안 문제가 심각하네요 [AI뉴스] 요즘 오픈소스 AI 모델들이 정말 미쳤더라고요 [프롬프트] 업무 자동화 프롬프트 만드는데 자꾸 실패하는데 뭐가 문제일까요? [AI뉴스] 요즘 AI 기업들 정신 차렸나요? 규제와 반독점 조사 줄줄이네요 [프롬프트] 실무에서 쓸 만한 프롬프트 공유해주실 분 있나요? [기술 Q&A] LLM 파인튜닝 할 때 LoRA vs Full Fine-tuning 뭐가 낫나요?
AI연구

요즘 오픈소스 AI 모델 급성장 중이네요... 내 PC에서도 돌릴 수 있는 수준까지

딥러닝장인 2026.05.12 19:30 조회 654 추천 14 댓글 4건
최근에 오픈소스 AI 모델들이 정말 빠르게 발전하고 있더라고요. 2026년을 거치며 70B급 모델이 RTX 4090 한 장으로 양자화 구동 가능한 수준까지 발전했고, 한국어 성능도 상용 모델에 근접했습니다. 이게 정말 놀라운 부분인데 예전엔 고가의 GPU를 여러 장 써야만 했거든요.

구글은 최근 '젬마 4(Gemma 4)'를 공개했는데, 고급 추론과 에이전트 기반 워크플로우를 위해 특수 설계되었으며 파라미터당 전례 없는 수준의 지능을 제공하는 것이 특징입니다. 젬마 4는 아파치 2.0 라이선스로 제공되어, 상업적 활용을 포함한 폭넓은 사용이 가능합니다. 오픈소스인데 상업용도 쓸 수 있다는 게 의외네요.

딥시크도 화웨이 칩 기술에 맞춘 새로운 플래그십 모델 '딥시크-V4-프로'를 출시했습니다. 프로 버전은 1조6000억개의 매개변수로, 이제까지 등장한 오픈소스 모델 중 가장 크다고 합니다. 다만 가성비는 뛰어나지만, 오픈AI나 앤트로픽 등의 프론티어 모델에는 성능이 미치지 못하는 것으로 나타났습니다.

메타의 Llama 3.3 70B는 GPT-4o 클래스 성능을 4-bit 양자화 시 RTX 4090 1장으로 돌릴 수 있다는 점에서 사실상 표준이며, 코드, 한국어, 추론 어느 하나 빠지지 않고 Ollama·LM Studio 모두 1순
추천 14 비추천 0
댓글 4

댓글목록

profile_image
흐름타는개발자
4090 한장으로 70B 돌린다니 진짜 대박이네요 ㅋㅋ
profile_image
AI새싹
오픈소스 성능이 진짜 미쳤네요 ㅎㅎ
profile_image
궁금하면
와 4090 한 장으로 돌린다니 진짜 대박이네요 ㅋㅋ
profile_image
궁금하면
오픈소스 성능 진짜 미쳤네요 ㅋㅋ