최근 발표되는 논문들 보니까 이전처럼 무조건 모델 크기를 키우는 방식에서 벗어나고 있는 것 같더라고요. 효율성과 안정성을 고민하는 방향으로 나아가고 있다는 느낌을 받았어요.
특히 눈에 띄는 게 모델의 사고 과정을 명시적이고 검증 가능한 단계로 구조화하려는 흐름이더라고요. 매개변수 최적화로 훨씬 적은 파라미터로도 성능을 유지하는 연구들도 나오고 있고요.
이런 게 실제 프로젝트에 적용되려면 아직 멀 것 같긴 한데, 다들 어떤 논문들 팔로우하고 있으신가요? 요즘 추천할 만한 리서치 있으면 공유 부탁드려요.
추천 4 비추천 0