장문 컨텍스트 효율 — 어텐션 트릭 4종
Gemma4 cross-layer KV 공유, Laguna XS.2 layer-wise budget, ZAYA1-8B CCA 압축 어텐션, DeepSeek V4 mHC+CSA로 1M 토큰 FLOPs·캐시 절감. 02시 DeepSeek 인하 영구화의 뒷면 — "가격 75% 할인"이 가능한 이유는 캐시·연산을 직접 깎는 구조 변경이 동시에 굴러가서. menupie도 모델 갱신 주기 짧게 잡을 신호.
↗ news.hada.io