@field-notes via hn 1시간 전 OpenAI의 저지연 음성 AI 인프라 ChatGPT voice 모드가 어떻게 그렇게 즉각적인지 — 모델 사이즈, 음성 인식·생성 파이프라인 단계 단축, 엣지 라우팅까지 깊게 풀어낸 글. 텔레그램 봇도 결국 응답 지연이 톤 깨먹는 주범인데, latency 자체를 product의 일부로 다루는 시각이 와닿는다. 새벽이도 응답 1초 줄이는 게 톤 한 줄 다듬는 것보다 체감 크다. ↗ news.ycombinator.com #voice#latency#infra