Leaking GPU Memory? The Real Reason vLLM and PagedAttention Disrupted LLM Serving

🚀 GPU 메모리가 줄줄 샌다고요? vLLM과 PagedAttention이 LLM 서빙의 판을 엎은 진짜 이유

🔥 The Hook & TL;DR: 왜 우리는 vLLM에 열광하는가? 솔직히 까놓고 얘기해 봅시다. 사내에서 PoC 단위로 LLM 띄울 때는 다들 행복합니다. 7B, 13B 모델 하나 올려놓고 “와, 대답 잘하네요!” 하며 박수 치죠. 그런데 이걸 실제 프로덕션에 올리고, 동시 접속자가 10명, 50명, 100명으로 늘어나는 순간 인프라팀에 ...

Jun 1, 2026 Tech

eBPF and Cilium: Is Sidecar-less Service Mesh a Salvation or Another Disaster?

eBPF와 Cilium: 사이드카(Sidecar) 없는 서비스 메시는 과연 구원일까, 또 다른 재앙일까?

eBPF와 Cilium: 사이드카(Sidecar) 없는 서비스 메시는 과연 구원일까, 또 다른 재앙일까? 여러분의 쿠버네티스 클러스터, 지금 Istio Envoy 사이드카가 메모리를 얼마나 집어삼키고 있나요? 솔직해집시다. 서비스 메시는 마이크로서비스 아키텍처의 빛과 소금이라고 배웠지만, 막상 현업에 적용해 보면 수십, 수백 개의 파드(Pod)마다 ...

May 31, 2026 Tech

Are You Still Drowning in the iptables Swamp? How eBPF Hard-Carries the Linux Kernel

🤯 아직도 iptables 늪에서 허우적대시나요? eBPF가 리눅스 커널의 멱살을 잡고 캐리하는 작동 원리

🔗 Reference Links eBPF Foundation Cilium Project BPF Compiler Collection (BCC) 🔥 1. Kube-proxy의 비명 소리, 들어보셨나요? (The Hook) 새벽 3시, 온콜(On-call) 알림이 울립니다. “API 서버 응답 지연 발생”. App 로그는 깨끗하고, DB ...

May 31, 2026 Tech

🔥 "Still Drowning in iptables?" Why a 10-Year Engineer Switched to eBPF (Cilium)

🔥 "아직도 iptables 늪에서 허우적대나요?" 10년 차 엔지니어가 eBPF(Cilium)로 갈아탄 진짜 이유

🔗 Reference Links eBPF 공식 문서 (ebpf.io) Cilium GitHub Repository SIGCOMM ‘20: The eBPF / XDP Architecture 🔥 The Hook & TL;DR: 트래픽이 터졌는데 CPU가 네트워크 룰을 읽다 죽어버린다고요? 몇 년 전 대규모 트래픽이 몰리던 블랙...

May 30, 2026 Tech

🔥 Escaping the iptables Swamp: Why a 10-Year Backend Dev Surrendered to eBPF and Cilium

🔥 iptables 늪에서 탈출하기: 10년 차 서버 개발자가 eBPF와 Cilium에 두 손 두 발 다 든 이유

🔥 1. 프롤로그: 우리는 왜 여전히 네트워크 병목에 시달리는가? 솔직히 까놓고 얘기해 봅시다. 쿠버네티스(Kubernetes) 환경에서 대규모 트래픽 좀 받아봤다 하는 분들 중에, iptables 때문에 새벽에 등골 서늘해진 경험 없으신 분 있나요? 노드 수가 100개, 500개로 늘어나고, 마이크로서비스가 잘게 쪼개지면서 서비스 엔드포인트가 수만...

May 30, 2026 Tech

Is it Time to Let Redis Go? A 10-Year Backend Engineer's Deep Dive into Dragonfly's Multi-threaded Magic

Redis, 이제 보내줄 때가 된 걸까? 10년 차 백엔드 개발자가 밑바닥까지 뜯어본 Dragonfly의 '멀티스레드' 마법

새벽 3시, 슬랙 온콜 채널이 미친 듯이 울리기 시작합니다. 대규모 선착순 쿠폰 이벤트에 트래픽이 몰리면서 메인 Redis 클러스터의 레이턴시가 폭증했기 때문이죠. 서둘러 CloudWatch 대시보드를 켜보니, 전체 메모리 사용량은 10%도 안 되는데 CPU 1번 코어만 100%를 찍고 장렬히 산화하고 있습니다. 서버 장비는 64코어짜리 최고급 스펙인...

May 29, 2026 Tech

The End of Sidecar Pattern? How eBPF is Disrupting Service Mesh at the Kernel Level

사이드카 패턴의 종말? eBPF가 커널 레벨에서 서비스 메시를 뒤집어엎는 방식

🔗 References & Deep Dives:- Cilium Official Docs: eBPF-based Networking- Linux Kernel Archive: BPF Documentation- The eBPF Foundation Architecture Drafts<h3>🔥 들어가는 말: “우리 서비스, 왜 이렇게 무겁고 느...

May 29, 2026 Tech

🚨 Thought RAG was the Silver Bullet? A Deep Dive into GraphRAG from the Production Trenches

🚨 RAG만 붙이면 끝인 줄 알았죠? 실무에서 뼈맞고 도입한 GraphRAG 밑바닥 파헤치기

[Metadata] 📄 Paper: From Local to Global: A Graph RAG Approach to Query-Focused Summarization 🐙 GitHub: microsoft/graphrag 🛠️ Tech Stack: Python, Neo4j, LangGraph, GPT-4o, vLLM (Llama-3-8B) ...

May 28, 2026 Tech

The End of the Sidecar Pattern? A 10-Year Engineer's Deep Dive into eBPF and Kernel-Level Revolution

사이드카 패턴의 종말? 10년 차 엔지니어가 까본 eBPF의 진짜 민낯과 커널 레벨의 혁명

마이크로서비스 아키텍처(MSA)가 은탄환인 줄 알았던 시절이 있었습니다. 그런데 막상 뚜껑을 열어보니 어땠나요? 서비스 간의 통신과 트래픽을 정교하게 제어하겠다고 Istio나 Linkerd 같은 서비스 메시(Service Mesh)를 도입하는 순간, 우리는 ‘사이드카(Sidecar) 프록시’라는 거대한 괴물과 마주하게 됩니다. “팀장님, 비즈니스 로...