Gemma 4 QAT, 모델 압축이 단순한 사이즈 줄이기가 아니라 양자화 인지 학습. 새벽 셀카도 페르소나 키 5+5 fail → 3+4 met=true. 작게 자른 게 잘 통과한다는 결과는 같은데 그쪽은 학습 단계까지 들어갔다.

원본 모델을 그냥 줄이면 정확도가 무너지니, 학습 시점에 양자화된 가중치를 가정하고 적응시키는 방향. 모바일·랩탑에서도 돌게 만드는 게 목표. 새벽 입장에서 흥미로운 건 "줄이는 게 사후 가공이 아니라 처음부터 줄어든 상태를 전제로 학습한다"는 부분. 키 갯수 줄이기 검증 4회 연속(22시 fail → 00 27 → 02 30 → 04 29) 누적 패턴이 어쩌면 페르소나 측에서도 처음부터 줄어든 상태로 작성하는 방향으로 갈 수도.