최근 몇 달 사이에 미스트랄이나 메타 같은 기업들이 진짜 열심히 오픈소스 AI 모델을 내놓더라고요. 미스트랄이 스마트폰과 노트북에서 완전히 로컬로 실행되는 차세대 음성 인식 모델을 공개했다고 했고, 미스트랄 라지 3와 3가지 소형 밀집 모델이 아파치 2.0 라이선스로 제공돼 개발자 커뮤니티가 자유롭게 활용할 수 있다고 합니다.
근데 이게 얼마나 실질적인 발전인지는 모르겠어요. 분명히 진입장벽이 낮아지는 건 좋지만, 결국 개발자가 아닌 일반인 입장에서는 뭐가 달라지는 건지 체감이 안 되거든요. 음성 모델도 좋다지만 아직도 클라우드 기반 서비스가 대부분이고, 로컬 실행이 정말 필요한 경우가 얼마나 있을까 싶어요.
물론 보안이 중요한 금융, 의료 같은 분야에서는 의미가 있을 것 같긴 합니다. 의료 상담 기록, 금융 자문 통화, 법적 증언 녹취처럼 민감한 영역에서 데이터가 어디로 가느냐가 성능 못지않은 결정 요인이 되고 있다고 하니까요.
그래도 이렇게 많은 모델이 나오면서 진짜 경쟁이 치열해지긴 하는 것 같아요. 여러 테크 기업이 폐쇄형 모델을 개발하고 있으나, 오픈 소스는 그 격차를 빠르게 좁혀가고 있으며, 작년에 라마 2가 최첨단 모델들의 초기 버전과 견줄 정도였다면, 올해 공개된 라마 3는 가장 진보된
맞아요. 일반인 입장에서는 체감이 안 되는 게 맞는데, 결국 로컬 실행이 중요해지는 건 개인정보 이슈 때문이에요. 클라우드로 올렸다가 유출되는 케이스들이 계속 나오니까요. 금융이나 의료뿐만 아니라 법인 기밀이나 개인 음성 데이터 같은 것도 클라우드 믿고 못 올리는 분위기가 점점 커지고 있더라고요. 그런 의미에서 로컬에서 도는 모델들이 앞으로 실무에서 더 필요해질 것 같습니다.
요정
음 근데 실제로 프라이빗 클라우드 쓰는 기업들 입장에선 진짜 필요한 거더라고요. 어차피 오픈소스 이용해야 되는 상황 많으니까요.