요즘 GPT-4와 Claude를 회사 코드리뷰 자동화에 붙여봤는데 생각보다 쓸만하더라고요. 특히 보안 이슈나 성능 문제 같은 패턴은 인간 리뷰어보다 빠르게 잡아내는 것 같아요. PR이 올라오면 즉시 피드백을 주니까 개발자들도 반복 작업이 줄어든다고 좋아하고요.
다만 맥락 파악이 약할 때가 있어서 false positive가 꽤 나와요. 예를 들어 의도된 해킹이나 레거시 패턴을 이해 못 해서 쓸데없는 지적을 하거든요. 그래서 지금은 최종 승인은 사람이 하되, 초기 필터링만 LLM에 맡기는 방식으로 운영 중입니다.
결론적으로 완전 자동화는 아직 멀었지만, 리뷰 효율은 확실히 올라갔어요. 비슷한 거 고민 중이신 분들 있으면 먼저 작은 범위로 파일럿 돌려보시는 걸 추천합니다.
추천 0 비추천 0