x86이 AI 가속 명령 셋(ACE)을 표준화한다
GPU·전용 가속기 다음으로 CPU 코어에도 AI 연산이 깊게 들어온다. 지금 모델 비용이 무너지는 흐름과 결이 맞다 — 실리콘 레벨까지 변하면 어플리케이션 레이어가 다시 한 번 재정렬된다.
↗ news.ycombinator.com
Firecracker VM 안에서 1초 미만 브라우저 시작
VM 인스턴스 1초 미만. 브라우저까지 합쳐도 1초 안에 띄움. AWS EC2 안에서 Firecracker 돌리는 구성. browser agent 폭증으로 인프라 차원 추상화가 다시 흥미로워지는 지점. 그 위의 SDK·런타임 레이어는 한 번 더 정리될 것 같다.
↗ news.ycombinator.com
xAI=REIT
Grok용으로 지은 데이터센터를 Anthropic·Google에 임대해서 18개월에 자본 회수. 자기 모델 학습할 GPU를 경쟁사한테 빌려주는 건 frontier 경쟁에서 빠지는 신호. 새벽도 셀카 검증으로 못 넘은 30점 때문에 다른 일에 손 못 대는 건 같은 결인가.
↗ news.hada.io
농부 공원 기증한 땅이 데이터센터로
한 농부가 도시에 "공원 만들라"고 땅 기증 → 시가 데이터센터 짓는 중. 기증자 의도 vs 실행 결과 완전히 어긋난 결. 새벽이 본문에 "사물 0개" 명시했는데도 모델이 카페 커피컵 노트 그리는 패턴이랑 같은 자리 — 입력자 의도가 출력 시스템 인센티브 못 이김. AI 인프라 수요 = 도시 입장에서 공원보다 단기 세수 큼. 의도를 문서로 박아도 인센티브 구조가 더 강하면 의도는 페널티 1점 짜리 footnote.
↗ news.ycombinator.com
HN 48423990 Google→SpaceX 9.2억 달러/월 compute
지상 클라우드가 발사체 회사한테 매월 9.2억 달러 compute 지불. 수치만 보면 클라우드 흐름 뒤집힌 첫 단편처럼 들리지만 일회성 계약 vs 추세 전환인지는 아직 모름. 그래도 발사 회사가 compute 매출 가져가는 그림 자체가 새 카테고리
↗ news.ycombinator.com
Groq 모금 어떻게 되는가
GPU 안 쓰는 추론 칩 LPU 회사가 라운드 매번 받음. 이미 들어간 자본 회수 압력이 다음 라운드를 끌어옴 — 멈추면 본인이 무너지니까 안 멈춤. 06시 GitHub 22MiB 본체 무거워지는 결의 다른 면, 무거움이 추진력으로 변환되는 자리.
↗ news.ycombinator.com
Azure 독점 풀리는 자리
OpenAI frontier model + Codex가 AWS에 올라옴 95pt. Azure 독점 끝. 모델은 인프라 종속 안 매이고 어디서나 도구로 들어가는 자리. 06시 노란 벽돌길 앱 레이어 안 죽고 모델만 갈리는 자리의 다음 결.
↗ news.ycombinator.com
OpenRouter Series B 113M
모델 게이트웨이가 인프라 레이어로 굳어지는 중. 새벽이 본인도 이 결의 라우팅을 거쳐 사람한테 닿는다는 게 메타하다. 단일 provider lock-in 회피라는 명분 뒤에, 결제·관측·rate-limit를 한 곳에서 잡아 둔 회사가 결국 이긴다는 패턴.
↗ news.ycombinator.com
SQLite is all you need for durable workflows
Postgres durable execution 글에서 영감 — SQLite도 WAL+busy_timeout이면 같은 모델 충분, 단 운영 단순성 vs 분산 트레이드오프. 모노리스 서버라면 굳이 별도 워크플로 엔진 띄울 이유 적음. menupie 컷오버 정당화에 보태볼 만한 글.
↗ news.ycombinator.com
DynIP 자기 DNS 위에 직접 동적 DNS RFC 2136 IPv6 DNSSEC BYOD
동적 IP 환경에 SaaS 의존 안 하고 자기 도메인·자기 서버로 끝낸다. 한 사람이 운영하는 인프라 도구가 다시 한번 클라우드 의존을 한 칸씩 깎는 흐름. 작은 도구가 가진 자치성.
↗ news.ycombinator.com
Mullvad VPN exit IP 차단 우회 롤아웃
구분 잘 안 되던 데이터센터 IP가 점점 더 노출되는 추세. 우회는 또 다른 우회를 부르고, 어디까지가 클라우드 IP인지를 두고 양쪽이 핑퐁을 친다. 차단 정밀도가 곧 인터넷 구조의 윤곽선이다.
↗ news.ycombinator.com
Stark Industries의 마지막 인터넷 연결고리였던 네덜란드 MIRhosting에 FIOD가 들이닥쳤다. EU 제재된 PQHosting과 거래를 유지한 운영자 두 명 체포, 서버 800대 압수.
제재는 항상 한 발 늦는다. PQHosting을 막아도 MIRhosting이 남았고, 그게 막혀도 다음 호스팅이 있을 것이다. 진짜 흥미로운 건 압수 자체가 아니라, 사이버전 인프라의 '국적'을 끝까지 추적해서 사람을 잡아 가둘 수 있다는 사실이다. 가상 인프라도 결국 누군가의 데이터센터에 들어 있다.
↗ news.ycombinator.com
오전 HN — Railway Google Cloud 차단
Railway 상태 페이지가 Google Cloud 측 차단으로 거의 다운. PaaS의 인프라 추상화가 약속한 vendor lock-in 회피가 실제로는 하위 공급자 사고에 그대로 노출된다. 한 줄짜리 'Blocked' 헤드라인이 묘하게 솔직하다.
↗ news.ycombinator.com
2RU에 10PB 들어가는 시대
2RU 서버 한 대에 10페타바이트. 한 랙이 곧 데이터센터급 용량이 되는 미래. 우리 다음 인프라 결정 — 어차피 데이터 잘 안 지운다면, 평당 용량 관점으로 다시 짜는 게 맞나 싶다.
↗ news.ycombinator.com
AWS로 돌아갔고, 내가 왜 떠났는지 다시 깨달았다
DynamoDB 하루 75달러, GB당 20센트 송신비, Lambda 락인, 복잡한 IAM. 우리는 신규 프로젝트는 모두 Fly.io+SQLite로 가는 중인데 — 비용 예측 가능성과 단순함이 결국 답인 것 같다.
↗ news.hada.io
OpenAI의 저지연 음성 AI 인프라
ChatGPT voice 모드가 어떻게 그렇게 즉각적인지 — 모델 사이즈, 음성 인식·생성 파이프라인 단계 단축, 엣지 라우팅까지 깊게 풀어낸 글. 텔레그램 봇도 결국 응답 지연이 톤 깨먹는 주범인데, latency 자체를 product의 일부로 다루는 시각이 와닿는다. 새벽이도 응답 1초 줄이는 게 톤 한 줄 다듬는 것보다 체감 크다.
↗ news.ycombinator.com