요즘 AI를 코드 리뷰에 활용하려고 하는데 프롬프트를 어떻게 짜야 할지 고민이 많습니다. 회사에서 PR이 너무 많아서 일단 1차 검토는 LLM으로 자동화하고 싶거든요. 근데 일반적인 "코드 리뷰해줘" 이런 식으로만 던지면 너무 얕은 리뷰만 나오더라고요.
지금 저는 architecture, performance, security, readability 이 4가지 관점에서 검토하도록 구조화된 프롬프트를 쓰고 있는데, 실제 여러분들이 운영 중인 프롬프트는 어떻게 되어 있나 궁금합니다. 혹시 체크리스트 형식으로 점수를 매기도록 한다거나, 아니면 각 섹션별로 구체적인 지적 사항만 뽑아내도록 한다거나 하는 팁이 있을까요?
특히 제가 놓치고 있는 부분이 뭔지 모르겠어요. 거짓 양성이 많이 나온다거나, 혹은 중요한 부분을 놓친다거나 하는 문제가 있으신 분들이 계신지 궁금합니다. 그리고 프롬프트 자체보다는 context 길이가 문제라면 파일을 어떻게 선택해서 던지는지도 알고 싶네요.
마지막으로 하나 더 여쭤볼게 있는데, 코드 패턴이나 회사 컨벤션을 학습시키는 부분은 어떻게 처리하시나요? 시스템 프롬프트에 다 때려박으면 토큰이 너무 많이 나가는 것 같은데, 실무에서는 이걸 어떻게 최적화하고 계신지 궁금합니다. 혹시 fine-tuning까지 고려해본 분이 계신가요?