콘텐츠로 이동

팟캐스트

최신 생성순이 아니라 추천 학습 순서대로 정리했습니다. 먼저 들을 레이어를 고르고, 각 레이어 안에서는 기초 문서부터 순서대로 따라가면 됩니다.

Published
93
Layers
13

지금 듣기

Node.js Event Loop의 동작과 병목 판단

L0 · 길이 미정

L0

런타임 & 프레임워크

서버 코드가 왜 그렇게 동작하는지 이해하는 출발점

4 episodes
  1. 10
    L0

    Node.js Event Loop의 동작과 병목 판단

    Node.js Event Loop가 왜 서버 동시성의 핵심인지, libuv와 Reactor 패턴을 중심으로 설명한다. CPU 블로킹, 실행 순서, Thread Pool 튜닝, Worker Threads 선택 기준까지 실무 진단 관점으로 정리한다.

    상세 보기
  2. 20
    L0

    TypeScript 컴파일과 NestJS 메타데이터

    TypeScript 컴파일의 큰 흐름과 타입 소거 원리를 설명하고, NestJS DI가 예외적으로 런타임 메타데이터를 활용하는 구조를 정리합니다. tsconfig 옵션과 대표적인 DI 실패 원인도 함께 짚습니다.

    상세 보기
  3. 30
    L0

    Nest.js를 이해하는 DI와 IoC의 기본 구조

    DI와 IoC는 Nest.js의 클래스, 모듈, 테스트 구조를 이해하는 핵심 개념이다. 객체를 누가 만들고 어떻게 주입하는지의 제어권을 기준으로, 동작 원리와 실패 포인트를 함께 짚는다.

    상세 보기
  4. 40
    L0

    NestJS Discovery Module로 자동 등록 이해하기

    NestJS Discovery Module은 IoC Container에 등록된 Provider와 Controller를 런타임에 탐색해, 데코레이터 기반 자동 등록 패턴을 구현하게 해주는 도구다. 슬랙봇 이벤트 핸들러처럼 새 기능을 추가할 때 중앙 등록 코드를 고치지 않는 구조를 이해하는 데 초점을 둔다.

    상세 보기

L1

백엔드 & API

HTTP부터 인증, 실시간 인터페이스까지 서버 입구를 다지는 단계

5 episodes
  1. 10
    L1

    HTTP 요청과 응답을 읽는 기본기

    HTTP는 요청과 응답으로 서비스를 연결하고, 상태 코드와 헤더로 문제의 단서를 남기는 통신 규약이다. 이 스크립트는 요청이 서버에 도달하는 과정, 버전별 성능 차이, 캐싱과 Keep-Alive, 실무 디버깅 포인트를 함께 정리한다.

    상세 보기
  2. 20
    L1

    API 설계의 기본 원칙과 실무 판단 기준

    API를 서비스의 인터페이스로 보고, REST가 HTTP 의미체계를 어떻게 계약으로 활용하는지 설명한다. PUT과 PATCH, 버전 관리, 페이지네이션, 응답 형식, 멱등성 키처럼 리뷰와 디버깅에서 바로 부딪히는 판단 기준을 정리한다.

    상세 보기
  3. 30
    L1

    인증과 인가를 나누어 디버깅하기

    인증은 사용자가 누구인지 확인하는 과정이고, 인가는 그 사용자가 무엇을 할 수 있는지 확인하는 과정이다. JWT, OAuth 2.0, OIDC, RBAC, AWS IAM까지 이 구분 위에서 동작한다.

    상세 보기
  4. 40
    L1

    웹 보안 기본기와 방어 레이어

    SQL Injection, XSS, CSRF, MITM, DDoS, 패스워드 해싱, 공급망 공격을 원인과 방어 관점에서 정리한다. 핵심은 사용자 입력과 자동 첨부 권한, 해석 컨텍스트, 무결성 검증을 여러 레이어에서 함께 다루는 것이다.

    상세 보기
  5. 50
    L1

    WebSocket과 gRPC의 통신 선택 기준

    WebSocket, gRPC, Webhook은 모두 요청과 응답을 다루지만, 연결을 유지하는 방식과 책임 경계가 다르다. 이 스크립트는 실시간 Push, 내부 서비스 통신, 외부 이벤트 수신, 로드밸런서와 장애 대응까지 핵심 판단 기준을 정리한다.

    상세 보기

L2

네트워킹

요청이 실제로 어떻게 흐르고 어디서 막히는지 보는 단계

4 episodes
  1. 10
    L2

    OSI 계층으로 읽는 웹 서버 흐름

    OSI 모델은 네트워크 문제를 계층별로 좁혀 진단하는 기준이고, Web Server와 Nginx는 요청이 내부 애플리케이션까지 흘러가는 과정을 이해하게 해준다. 특히 502와 504, TLS 인증서, Health Check, Security Group 같은 실무 장애를 계층 관점으로 구분하는 데 초점을 둔다.

    상세 보기
  2. 20
    L2

    TCP와 UDP 내부 동작의 핵심

    TCP와 UDP의 연결 수립, 흐름 제어, 혼잡 제어, 종료 상태를 중심으로 네트워크 장애를 해석하는 기준을 정리한다. QUIC, ALB와 NLB, Keep-Alive, Nagle 알고리즘 같은 실무 연결 지점도 함께 짚는다.

    상세 보기
  3. 30
    L2

    DNS 기본기와 Route 53 운영 포인트

    DNS의 계층 구조, 캐싱, TTL, Route 53 설정을 실무 관점에서 정리합니다. 특히 Alias Record, 라우팅 정책, Health Check, negative caching처럼 장애로 이어지기 쉬운 지점을 함께 짚습니다.

    상세 보기
  4. 40
    L2

    HTTP 캐시, 빠른 응답 뒤의 제어 구조

    HTTP 캐시는 응답 속도만 높이는 장치가 아니라 서버 부하, 네트워크 비용, 장애 대응, 보안 경계를 함께 다루는 인프라 레이어다. Cache-Control, ETag, Vary, stale 전략, 무효화 방식을 기준으로 실무에서 무엇을 캐시하고 무엇을 캐시하면 안 되는지 정리한다.

    상세 보기

L3

AWS 인프라 & 보안

배포와 운영 환경의 기본 구조를 AWS 기준으로 익히는 단계

7 episodes
  1. 10
    L3

    IAM 권한 구조와 운영 실패 포인트

    IAM은 AWS의 모든 접근을 통제하는 권한 시스템이며, 설정 실수는 단순 에러를 넘어 침해의 주요 진입로가 된다. 이 에피소드에서는 User, Role, Policy, 평가 순서, 임시 자격증명, ECS와 CI/CD에서의 흔한 실패를 중심으로 IAM을 정리한다.

    상세 보기
  2. 20
    L3

    VPC와 Subnet, Security Group의 실무 감각

    AWS 네트워크의 기본 단위인 VPC, Subnet, Security Group을 CIDR 설계, 라우팅, 상태 추적, NAT와 Endpoint 관점에서 정리한다. 통신 장애와 비용 문제를 실제 운영에서 어떻게 좁혀 볼지 함께 다룬다.

    상세 보기
  3. 30
    L3

    S3의 구조, 비용, 보안 판단 기준

    S3를 버킷, 객체, Key 구조로 이해하고, 스토리지 클래스와 Lifecycle Policy, 보안 설정, 장애 증상을 실무 관점에서 정리한다. CloudFront 연동과 S3 Express One Zone의 선택 기준까지 함께 다룬다.

    상세 보기
  4. 40
    L3

    RDS 기본기와 운영에서 터지는 지점

    RDS는 백업, 패치, 장애 전환을 관리형으로 맡기는 데이터베이스 서비스이지만, Multi-AZ, Read Replica, Connection Pool, RDS Proxy의 경계를 이해해야 운영 장애를 줄일 수 있다. 특히 DNS 캐시, 복제 지연, 연결 수 초과, 네트워크 접근 조건처럼 에러가 명확하지 않거나 환경별로 다르게 보이는 지점을 중심으로 살펴본다.

    상세 보기
  5. 50
    L3

    ECS와 EC2, 서버와 컨테이너 운영의 차이

    EC2는 직접 관리하는 가상 서버이고, ECS는 Docker 컨테이너를 정의한 개수와 리소스로 실행하고 유지하는 관리 방식이다. Fargate, 네트워킹, 배포, 오토스케일링, 비용, 장애 대응 흐름까지 실무 관점에서 연결해 이해한다.

    상세 보기
  6. 60
    L3

    네트워크 보안의 계층과 실무 판단 기준

    이 에피소드는 애플리케이션 보안과 VPC 격리만으로 막기 어려운 공격을 WAF, Shield, Security Group, NACL, TLS 계층으로 나누어 설명한다. 특히 Managed Rules의 오탐, Shield Standard의 한계, HTTPS 종단과 실무 장애 포인트를 함께 짚는다.

    상세 보기
  7. 70
    L3

    Secrets Management, 유출 이후가 아니라 유출 전의 설계

    시크릿 관리는 값을 숨기는 기능 하나가 아니라, 유출 피해 반경과 회전, 감사, 런타임 주입을 함께 설계하는 문제다. AWS Secrets Manager, Parameter Store, Vault, 멀티클라우드 전이 원리까지 실무 선택 기준과 실패 지점을 중심으로 정리한다.

    상세 보기

L4

OS & 리눅스

프로세스, 메모리, 스케줄링 같은 서버의 바닥 원리를 익히는 단계

7 episodes
  1. 10
    L4

    서버 운영의 언어, Linux 기본기

    Linux 기본기는 서버 로그 확인, 프로세스 진단, 파일 권한, 컨테이너 디버깅을 이어 주는 공통 언어다. 이 스크립트는 inode, 프로세스와 시그널, 권한, systemd, 보안 하드닝까지 실무 장애 대응 관점에서 정리한다.

    상세 보기
  2. 20
    L4

    프로세스와 스레드, 격리와 공유의 비용

    프로세스와 스레드는 메모리 격리와 공유 방식이 다르고, 그 차이가 장애 격리, 성능 튜닝, 메모리 누수 대응으로 이어진다. Node.js의 cluster, worker_threads, PM2, ECS 선택도 결국 이 구조를 이해해야 판단할 수 있다.

    상세 보기
  3. 30
    L4

    시스템 콜, 인터럽트, IPC의 실제 경계

    유저 프로그램이 커널 기능을 요청하는 시스템 콜, 하드웨어 이벤트를 알리는 인터럽트, 프로세스 간 통신인 IPC를 Node.js와 운영 관점에서 연결해 설명한다. 성능 비용, epoll과 io_uring의 선택 기준, 파일 디스크립터와 조용한 실패 같은 실무 함정까지 함께 다룬다.

    상세 보기
  4. 40
    L4

    메모리 관리가 운영 문제로 드러나는 순간

    가상 메모리, 페이징, 페이지 폴트, 교체 알고리즘이 어떻게 프로세스 격리와 성능을 만든는지 설명한다. Redis, Docker, Node.js, THP 사례를 통해 운영 중 만나는 메모리 장애와 선택 기준까지 연결한다.

    상세 보기
  5. 50
    L4

    CPU 스케줄링의 선택 기준과 실패 모드

    CPU 스케줄링은 어떤 작업에 CPU를 언제, 얼마나 줄지 정하는 운영체제의 핵심 정책이다. FCFS, SJF, Round Robin, Priority의 원리와 실패 모드가 Linux, Kubernetes, Node.js까지 어떻게 이어지는지 살펴본다.

    상세 보기
  6. 60
    L4

    공유 자원을 다루는 동시성 제어의 핵심

    동시성 문제는 여러 실행 흐름이 같은 자원을 건드릴 때 결과가 순서에 따라 흔들리는 문제다. Mutex, Semaphore, Deadlock, Memory Barrier를 중심으로 실무에서 어떤 실패가 생기고 어떻게 경계를 세우는지 정리한다.

    상세 보기
  7. 70
    L4

    cgroups와 Namespace로 보는 컨테이너의 실제 경계

    컨테이너는 Host 커널을 공유하면서 Namespace로 보이는 세계를 나누고, cgroups로 CPU와 메모리 같은 자원 한계를 강제한다. Docker, ECS, K8s의 limits와 OOM Kill, CPU throttle이 커널 수준에서 어떻게 이어지는지 정리한다.

    상세 보기

L5

플랫폼 엔지니어링 & 자동화

배포 파이프라인과 플랫폼 운영 자동화를 연결하는 단계

8 episodes
  1. 10
    L5

    플랫폼 엔지니어링과 개발자 셀프서비스

    플랫폼 엔지니어링은 개발자가 인프라 대기와 반복 요청에 묶이지 않고 스스로 안전한 환경을 만들게 하는 접근이다. 핵심은 외재적 인지 부하를 줄이고, Golden Path와 가드레일, 측정 가능한 흐름 지표로 내부 플랫폼을 제품처럼 운영하는 데 있다.

    상세 보기
  2. 20
    L5

    Docker를 이해하는 핵심 구조

    Docker는 애플리케이션을 환경째 패키징해 로컬 개발, CI/CD, 배포 환경의 차이를 줄이는 기술이다. 이 스크립트는 컨테이너 격리, 이미지 레이어, 네트워크, 보안, 운영 판단 기준을 중심으로 Docker의 동작 원리를 정리한다.

    상세 보기
  3. 30
    L5

    CI/CD 파이프라인과 배포 전략의 기준

    CI/CD의 기본 흐름을 격리된 빌드, 불변 아티팩트, 파이프라인 as Code 관점에서 정리한다. OIDC 인증, 배포 전략 선택, 캐시 최적화, 주요 장애 진단 포인트까지 함께 짚는다.

    상세 보기
  4. 40
    L5

    Git Flow와 브랜치 전략의 선택 기준

    Git Flow, GitHub Flow, Trunk-Based Development가 어떤 문제를 해결하는지와 각각의 운영 조건을 비교한다. 브랜치 보호 규칙, 머지 전략, Feature Flag, 실무 실패 패턴까지 연결해 팀 상황에 맞는 선택 기준을 정리한다.

    상세 보기
  5. 50
    L5

    Terraform과 IaC의 핵심 구조

    Terraform은 인프라를 HCL 코드와 State, DAG 기반 실행으로 재현 가능한 변경 문제로 바꾸는 IaC 도구다. 이 스크립트는 State 관리, 환경 분리, 모듈화, 드리프트, 도구 선택과 주요 실패 모드를 함께 정리한다.

    상세 보기
  6. 60
    L5

    Kubernetes를 운영 관점에서 이해하기

    Kubernetes의 핵심 오브젝트, 선언적 관리, 스케줄링과 네트워킹, 자동 스케일링을 운영 관점에서 풀어 설명한다. ECS에서 EKS로 넘어갈 때의 비교 지점과 프로덕션에서 자주 만나는 실패 모드까지 함께 정리한다.

    상세 보기
  7. 70
    L5

    GitOps와 조정 루프의 운영 감각

    GitOps는 Git을 원하는 상태의 기준으로 두고, 클러스터 안의 에이전트가 실제 상태를 지속적으로 맞추는 운영 방법론입니다. ArgoCD와 FluxCD의 선택 기준, 조정 루프, 시크릿과 Helm 주의점, 프로덕션 운영 실패 포인트까지 함께 정리합니다.

    상세 보기
  8. 80
    L5

    IDP, 반복 요청을 제품화하는 플랫폼

    IDP는 반복되는 인프라·배포·운영 요청을 Golden Path로 제품화해 개발자의 인지 부하와 대기 시간을 줄이는 내부 플랫폼이다. 핵심은 포탈 UI가 아니라 선언적 인터페이스, 자동화 백엔드, 관찰 가능한 검증, 그리고 개발자 중심의 제품 운영이다.

    상세 보기

L6

운영 & 관측성

장애를 줄이고 복구 속도를 높이는 운영 패턴을 익히는 단계

7 episodes
  1. 10
    L6

    Queue와 Worker로 비동기 작업 분리하기

    Queue와 Worker는 요청 흐름과 느린 작업 흐름을 분리해 서버 과부하와 실패 복구 문제를 다루는 기본 패턴이다. SQS의 전달 특성, Visibility Timeout, DLQ, 큐 선택 기준과 대표 장애 대응을 함께 정리한다.

    상세 보기
  2. 20
    L6

    재시도, 백오프, 멱등성의 안전한 조합

    네트워크 실패를 재시도로 넘길 때는 Backoff와 Jitter로 부하를 분산하고, Idempotency Key로 중복 부작용을 막아야 한다. 실패율, 호출 비용, 부작용 여부, 요청 deadline, 체인 깊이에 따라 Retry, Circuit Breaker, Fallback을 나눠 선택한다.

    상세 보기
  3. 30
    L6

    EDA로 이해하는 서비스 간 이벤트 흐름

    EDA는 이벤트 발행과 구독을 통해 서비스 간 직접 의존을 줄이는 아키텍처다. 브로커 선택, 비동기 처리의 경계, 중복 처리와 유실 방지 같은 실무 판단 기준까지 함께 이해해야 한다.

    상세 보기
  4. 40
    L6

    Redis 복원력 패턴의 선택 기준

    Redis는 단순한 빠른 저장소가 아니라 DB 과부하를 흡수하고 장애 전파를 끊는 복원력 인프라로 다뤄야 한다. 이 스크립트는 캐시 전략, Fallback, Circuit Breaker, Rate Limiting, Cache Stampede 방지, 운영 장애 포인트를 선택 기준 중심으로 정리한다.

    상세 보기
  5. 50
    L6

    CloudWatch로 보는 AWS 모니터링의 기본 구조

    CloudWatch의 Metrics, Logs, Alarms가 어떻게 연결되어 장애 대응의 출발점이 되는지 설명한다. 비용 함정, 알람 상태, ECS Fargate 관측, 트러블슈팅 포인트까지 원문 범위에서 정리한다.

    상세 보기
  6. 60
    L6

    Logs Metrics Traces로 장애 위치 찾기

    Observability의 세 기둥인 Logs, Metrics, Traces가 각각 무엇을 보여주고, 장애 대응에서 어떻게 함께 쓰이는지 정리한다. ADOT와 Collector 기반 수집, 구조화 로그, Golden Signals, Trace 전파, 그리고 대표 실패 모드를 함께 다룬다.

    상세 보기
  7. 70
    L6

    SRE 프랙티스, 지표를 운영 결정으로 바꾸는 법

    SRE 프랙티스는 관측성 데이터를 SLI, SLO, Error Budget, 정책 실행으로 연결해 배포와 안정화 결정을 수치화하는 방법이다. 이 스크립트는 SLI/SLO/SLA, Error Budget, 장애 대응, Postmortem, Toil 제거의 핵심 메커니즘과 흔한 실패 모드를 정리한다.

    상세 보기

L7

네트워크 심화

TLS, CDN, HTTP/3처럼 실전 네트워크 병목을 다루는 단계

5 episodes
  1. 10
    L7

    TCP 흐름과 혼잡 제어를 운영 관점에서 읽기

    TCP의 흐름 제어와 혼잡 제어를 TTFB, 클라우드 통신, 장애 분석 관점에서 정리합니다. cwnd, rwnd, rtt, retrans 같은 신호를 바탕으로 병목을 분리하고, Cubic과 BBR 선택 시 봐야 할 실패 조건까지 다룹니다.

    상세 보기
  2. 20
    L7

    TLS와 HTTPS의 작동 원리

    TLS는 평문 HTTP에 암호화, 무결성, 인증을 더해 HTTPS를 구성하는 보안 계층이다. 이 스크립트는 핸드셰이크, 인증서 체인, TLS 1.3, SNI, mTLS, 종료 지점과 운영 장애 포인트를 연결해 설명한다.

    상세 보기
  3. 30
    L7

    HTTP/2와 HTTP/3, 성능을 바꾸는 경계

    HTTP/2와 HTTP/3가 요청 병렬성, 핸드셰이크, 헤더 압축, 패킷 손실 회복 방식을 어떻게 바꾸는지 설명한다. gRPC, ALB, Nginx, DevTools 디버깅에서 어떤 판단 기준이 필요한지도 함께 짚는다.

    상세 보기
  4. 40
    L7

    DNS 보안과 CloudFront 캐시 운영

    DNSSEC, DoH와 DoT, Route 53 라우팅, CloudFront 캐시 구조를 운영 관점에서 정리합니다. 특히 배포 후 구버전 콘텐츠, Failover 헬스 체크, SPA 새로고침 오류처럼 실제 장애로 이어지는 지점을 중심으로 봅니다.

    상세 보기
  5. 50
    L7

    계층으로 좁히는 네트워크 디버깅

    네트워크 장애를 추측으로 처리하지 않고, L3부터 L7까지 계층별로 좁혀 가는 관점을 다룹니다. 패킷 캡처, 경로 추적, VPC Flow Logs, 컨테이너 디버깅 도구를 어떤 상황에서 선택할지 정리합니다.

    상세 보기

L8

데이터베이스

트랜잭션부터 복제, CQRS까지 저장소 설계를 깊게 보는 단계

6 episodes
  1. 10
    L8

    트랜잭션이 지키는 데이터의 경계

    트랜잭션은 여러 데이터 변경을 하나의 단위로 묶어 부분 처리 상태를 막는 장치다. WAL, Lock, MVCC, 격리 수준, TypeORM 사용 시의 실패 모드를 함께 이해해야 운영 중 정합성 문제를 진단할 수 있다.

    상세 보기
  2. 20
    L8

    DB 모델링, 일관성과 성능의 균형

    DB 모델링은 정규화로 데이터 일관성을 지키고, 성능이 필요한 지점에서만 비정규화를 선택하는 작업이다. RDBMS와 NoSQL 선택, 격리 수준, CDC, Materialized View, ORM 운영 실패까지 함께 판단해야 한다.

    상세 보기
  3. 30
    L8

    DB 인덱스와 쿼리 최적화의 실제 판단법

    대량 테이블에서 인덱스가 왜 필요한지부터 B+Tree 구조, EXPLAIN ANALYZE 해석, 조인 플래너 판단, TypeORM의 N+1 문제까지 연결해 설명한다. 인덱스는 읽기를 빠르게 하지만 쓰기와 운영 비용을 만들기 때문에, 실제 슬로우 쿼리와 실행 계획을 보고 정확히 추가해야 한다.

    상세 보기
  4. 40
    L8

    DB 복제와 샤딩의 핵심 구조

    Replication은 데이터를 복사해 읽기 부하와 장애 대응을 분산하고, Sharding은 데이터를 나누어 쓰기 부하와 용량 한계를 넘는 방식이다. 이 둘은 Replica Lag, Hot Shard, CAP 선택처럼 분산 시스템의 성능과 일관성 문제로 이어진다.

    상세 보기
  5. 50
    L8

    Redis 내부 원리와 ElastiCache 운영의 기준

    Redis의 자료구조 인코딩, 단일 스레드 이벤트 루프, 영속화, 클러스터 운영 기준을 내부 메커니즘 중심으로 정리한다. ElastiCache 운영 지표와 장애 진단 포인트까지 연결해, 어떤 원리가 어떤 실무 판단으로 이어지는지 설명한다.

    상세 보기
  6. 60
    L8

    CDC와 Outbox로 이벤트 발행을 지키는 법

    CDC와 Outbox는 DB 변경과 메시지 발행 사이의 partial failure를 줄이기 위해, 트랜잭션 원자성과 비동기 발행을 결합하는 패턴이다. 이 스크립트는 PostgreSQL Logical Decoding, Debezium, Outbox Event Router, at-least-once 운영 현실과 주요 장애 런북을 연결해 설명한다.

    상세 보기

L9

아키텍처 & 설계

설계 원칙과 분산 시스템 판단력을 키우는 단계

12 episodes
  1. 10
    L9

    설계 원칙을 운영 가능한 코드로 잇기

    Clean Architecture, DDD, Twelve-Factor App이 각각 코드 구조, 도메인 모델링, 배포와 운영 철학을 어떻게 나누어 담당하는지 설명한다. 이어서 SOLID, ADR, NestJS 기준 안티패턴과 장애 징후를 통해 설계 원칙이 실제 코드와 운영에서 드러나는 방식을 정리한다.

    상세 보기
  2. 20
    L9

    Clean Architecture의 의존성 규칙

    Clean Architecture는 비즈니스 로직이 프레임워크와 인프라에 끌려가지 않게 의존 방향을 안쪽으로 고정하는 설계 방식이다. NestJS DI, DIP, 경계 도입 기준, 과소 설계와 과대 설계의 실패 모드를 함께 짚는다.

    상세 보기
  3. 30
    L9

    DDD 기본기: 도메인 언어와 경계 설계

    DDD는 비즈니스 언어와 코드 모델의 거리를 줄이고, Bounded Context로 도메인 경계를 나누는 설계 방식이다. 전략적 설계와 전술적 설계를 통해 모듈러 모놀리스에서 MSA로 진화할 수 있는 근거를 만든다.

    상세 보기
  4. 40
    L9

    Twelve-Factor App 운영 원칙

    Twelve-Factor App은 로컬, 배포, 운영 환경의 계약을 맞춰 클라우드에서 같은 방식으로 동작하게 만드는 12가지 원칙이다. 특히 Config, Processes, Disposability, Logs는 배포 직후 장애와 직접 연결된다.

    상세 보기
  5. 50
    L9

    CAP과 일관성으로 보는 분산 시스템 선택

    분산 시스템에서 네트워크 파티션이 생기면 일관성과 가용성 중 무엇을 포기할지 선택해야 한다. CAP, PACELC, Consistency 모델을 기준으로 Aurora, DynamoDB, S3, ElastiCache의 선택 기준과 실무 함정을 정리한다.

    상세 보기
  6. 60
    L9

    MSA 패턴, 분리의 이득과 운영 비용

    MSA는 독립 배포, 독립 확장, 장애 격리를 얻기 위해 서비스를 나누는 아키텍처 패턴의 집합이다. 다만 API Gateway, Service Mesh, Circuit Breaker, Saga, Outbox 같은 주변 패턴까지 함께 운영해야 하므로 도입 기준과 실패 조건을 함께 봐야 한다.

    상세 보기
  7. 70
    L9

    Saga Pattern: 로컬 커밋과 역순 보상

    Saga Pattern은 여러 서비스에 걸친 작업을 단일 분산 락 대신 로컬 트랜잭션과 보상 트랜잭션으로 나누어 처리하는 방식이다. 핵심은 각 단계를 커밋하되 실패하면 역순으로 보상하고, 그 과정에서 메시지 유실, 중복 처리, isolation 부재를 별도로 설계하는 데 있다.

    상세 보기
  8. 80
    L9

    CQRS와 이벤트 소싱의 운영 경계

    CQRS는 읽기와 쓰기의 요구사항 차이를 분리해 각각 최적화하고, Event Sourcing은 현재 상태가 아니라 변경 이벤트를 저장해 이력과 재생 가능성을 확보한다. 두 패턴은 Outbox, Kafka, CDC, WAL, 저장소 선택, 운영 실패 모드까지 함께 보아야 실제 시스템에서 의미가 생긴다.

    상세 보기
  9. 90
    L9

    TDD와 테스트 피라미드로 설계하는 테스트 전략

    테스트 전략의 핵심은 테스트가 있는지보다 피드백이 충분히 빠르고 신뢰 가능한지에 있다. TDD, 테스트 피라미드, 도구 선택, AWS 연동 테스트와 flaky 대응 기준을 연결해 실무 판단 기준으로 정리한다.

    상세 보기
  10. 100
    L9

    대규모 웹 크롤러의 큐, 정중함, 중복 제거

    대규모 웹 크롤러는 URL을 많이 가져오는 문제가 아니라, 우선순위와 정중함, 중복 제거, 장애 복구를 동시에 만족시키는 분산 시스템 설계 문제다. URL Frontier, robots.txt 처리, Bloom filter와 SimHash, 큐 기반 컴포넌트 분리, at-least-once와 멱등성까지 핵심 메커니즘을 연결해 살펴본다.

    상세 보기
  11. 110
    L9

    API 계약으로 안전하게 서비스 경계를 진화시키기

    API 설계와 계약을 코드보다 먼저 다루면 서비스 간 통합 실패를 PR 단계에서 발견할 수 있다. OpenAPI, Contract Testing, Versioning, Idempotency, RFC 9457 에러 형식을 중심으로 안전하게 API를 바꾸는 기준을 정리한다.

    상세 보기
  12. 120
    L9

    URL Shortener와 Rate Limiter로 보는 시스템 디자인

    URL Shortener와 Rate Limiter를 통해 시스템 디자인이 정답 컴포넌트 암기가 아니라 제약과 트레이드오프를 다루는 절차임을 정리합니다. 코드 생성, 제한 알고리즘, 저장소 역할, 운영 함정을 비교하며 두 케이스가 어떻게 다르게 풀리는지 살펴봅니다.

    상세 보기

L10

자료구조 & 알고리즘

문제 해결 기본기를 다시 압축해서 정리하는 단계

4 episodes
  1. 10
    L10

    자료구조 선택이 성능을 바꾸는 방식

    자료구조는 데이터를 어떻게 배치하고 접근할지 결정하고, Big-O는 그 결정이 입력 크기와 함께 어떤 비용으로 커지는지 보여준다. Array, Linked List, Stack, Queue, Hash Table의 원리와 실무 선택 기준, 그리고 JavaScript와 백엔드 환경에서 자주 만나는 실패 모드를 함께 정리한다.

    상세 보기
  2. 20
    L10

    정렬과 탐색, 실무 성능의 기본 선택지

    정렬, 이진 탐색, LRU 캐시, 문자열 검색을 실무 성능과 실패 모드 중심으로 풀어낸다. 알고리즘 선택에서 지배 연산, 입력 분포, 자원 예산을 어떻게 봐야 하는지도 함께 정리한다.

    상세 보기
  3. 30
    L10

    BST, Heap, Graph를 실무 구조로 읽기

    BST는 정렬된 탐색, Heap은 우선순위 접근, Graph는 관계 탐색을 다루는 핵심 자료구조다. 이 세 구조가 DB 인덱싱, 작업 스케줄링, 의존성 관리에서 어떻게 드러나는지와 잘못 선택했을 때의 실패 신호를 함께 정리한다.

    상세 보기
  4. 40
    L10

    알고리즘 패러다임, 문제를 보는 첫 기준

    DP, Greedy, Divide and Conquer, Backtracking의 선택 기준과 실패 모드를 중심으로 알고리즘 패러다임을 정리한다. 검색 엔진의 유사도 메트릭, 역색인, BM25까지 연결해 실무에서 어떤 관점으로 문제를 분류해야 하는지 다룬다.

    상세 보기

L11

AI 기초 & 머신러닝

수학 토대부터 트랜스포머와 post-training까지 AI 기본기를 잡는 단계

9 episodes
  1. 10
    L11

    ML을 디버깅 가능한 시스템으로 보는 수학 토대

    ML 학습을 선형대수, 확률, 미적분의 반복으로 보고, 벡터·행렬·분포·gradient가 실제 운영 판단에 어떻게 연결되는지 정리한다. 특히 attention 비용, softmax 안정성, KV cache 산정처럼 장애와 비용으로 드러나는 지점을 함께 짚는다.

    상세 보기
  2. 20
    L11

    고전 ML로 읽는 현대 LLM 운영

    고전 ML의 회귀, 트리, SVM, 군집화, PCA를 훑고, overfitting과 regularization, bias-variance가 LLM 운영 판단에 어떻게 이어지는지 설명한다. 특히 tabular baseline, silent failure, 비용 대비 성능 판단처럼 실제 운영에서 놓치기 쉬운 기준을 중심으로 정리한다.

    상세 보기
  3. 30
    L11

    ML 패러다임을 나누는 학습 신호와 운영 판단

    ML 패러다임을 정답 레이블, 데이터 자체의 신호, 보상과 선호라는 관점에서 정리하고, LLM 운영에서 비용과 안정성을 어떻게 판단하는지 설명한다. Fine-tune, RAG, prompt 선택 기준과 alignment silent failure 탐지까지 함께 다룬다.

    상세 보기
  4. 40
    L11

    신경망과 역전파, LLM 운영의 기본 비용 모델

    신경망은 선형 변환과 비선형 활성화의 합성이고, 역전파는 체인룰로 gradient를 거꾸로 계산하는 학습 메커니즘이다. 이 구조를 이해하면 vanishing gradient, NaN, GPU 메모리, full fine-tuning과 LoRA, QLoRA 선택까지 한 줄로 연결된다.

    상세 보기
  5. 50
    L11

    트랜스포머와 Attention의 운영 직관

    트랜스포머의 핵심인 self-attention이 어떻게 토큰 관계를 계산하는지 설명하고, 현대 LLM에서 KV cache, FlashAttention, long-context 최적화가 왜 비용과 성능의 중심이 되는지 정리한다.

    상세 보기
  6. 60
    L11

    Scaling Laws와 Pre-training의 비용 감각

    Scaling laws는 모델 크기, 데이터, 연산량 사이의 power law 관계를 통해 pre-training을 자원 할당 문제로 바꾸는 관점이다. Chinchilla, LLaMA, 분산 학습, 데이터 큐레이션, test-time compute까지 이어지는 운영 판단 기준을 정리한다.

    상세 보기
  7. 70
    L11

    토크나이저와 임베딩의 운영 감각

    토크나이저는 LLM 비용과 컨텍스트 활용도를 좌우하고, 임베딩은 RAG와 검색 품질의 토대가 된다. 이 스크립트는 한국어 토큰 효율, 임베딩 모델 선택, 차원 축소, reranker와 hybrid search, 운영 silent failure까지 연결해 설명한다.

    상세 보기
  8. 80
    L11

    모델 평가는 데이터 품질에서 시작된다

    모델 평가는 단일 점수가 아니라 지표 선택, 데이터 품질, 회귀 검증, 통계적 판정을 함께 다루는 운영 체계다. 특히 LLM 운영에서는 공개 벤치마크보다 자기 도메인 gold dataset과 judge bias 관리가 더 직접적인 기준이 된다.

    상세 보기
  9. 90
    L11

    Post-training과 Alignment의 운영 지도

    base 모델을 실제 서비스에서 쓸 수 있는 모델로 만들기 위해 SFT, PEFT, DPO, RLHF, GRPO, RLVR가 어떤 역할을 하는지 설명한다. 비용, 데이터 품질, silent failure, fine-tune과 RAG와 prompt의 선택 기준까지 운영 관점에서 정리한다.

    상세 보기

L12

AI 시스템 & LLM 애플리케이션

프롬프트, RAG, tool/MCP, agent orchestration에 비용/관측/보안까지 LLM 앱 운영을 익히는 단계

15 episodes
  1. 10
    L12

    LLM API 기초와 운영 감각

    LLM API는 챗봇, RAG, 에이전트가 공통으로 올라가는 진입점이며, 토큰 비용과 지연, 출력 품질, 운영 안정성을 함께 다뤄야 한다. 이 스크립트는 메시지 구조, 샘플링, structured output, streaming, 비용 최적화, 장애 대응까지 API 운영 관점의 핵심을 정리한다.

    상세 보기
  2. 20
    L12

    운영 자산으로 보는 프롬프트 엔지니어링

    프롬프트 엔지니어링은 단순한 문장 작성이 아니라 비용, 품질, 지연, 보안을 함께 다루는 LLM 운영 기술이다. 이 스크립트는 fine-tuning과의 트레이드오프, 핵심 패턴, provider별 차이, 회귀 검증과 prompt injection 방어까지 운영 관점에서 정리한다.

    상세 보기
  3. 30
    L12

    임베딩과 벡터 운영의 핵심 경로

    임베딩 운영은 벡터 저장소 선택, ANN 인덱스, chunking, hybrid search, reranker, quantization, 갱신 파이프라인이 함께 맞물리는 영역입니다. 검색 품질뿐 아니라 비용, latency, 권한, freshness까지 운영 지표로 다뤄야 합니다.

    상세 보기
  4. 40
    L12

    RAG 기초: 검색, 주입, 생성의 운영 기준

    RAG는 외부 지식을 검색해 LLM 컨텍스트에 주입하고 답변을 생성하는 패턴이다. 이 스크립트는 RAG가 필요한 이유, 검색 품질을 올리는 단계, 평가와 운영 실패 조건, 대안과의 선택 기준을 정리한다.

    상세 보기
  5. 50
    L12

    LLM 도구 호출의 설계와 운영

    도구·함수 호출은 LLM이 외부 함수, API, 파일시스템, 데이터 소스와 연결되는 기본 인터페이스다. 이 에피소드는 schema 설계, parallel 호출, MCP, BFCL 평가, 보안과 silent failure까지 운영 관점에서 정리한다.

    상세 보기
  6. 60
    L12

    에이전트 오케스트레이션 운영 기준

    에이전트 오케스트레이션은 LLM이 도구와 상태를 사용해 다음 행동을 자율적으로 정하게 만드는 구조다. 핵심은 workflow를 기본값으로 두고, 비용과 실패 모드가 정당화되는 비정형 작업에만 agent와 multi-agent를 신중히 쓰는 것이다.

    상세 보기
  7. 70
    L12

    LLM 비용과 지연을 운영 지표로 읽는 법

    LLM 비용과 지연은 입력과 출력, prefill과 decode, 캐시와 라우팅의 비대칭을 이해해야 운영할 수 있다. Prompt caching, Batch API, 모델 라우팅, self-hosting, reasoning 모델 선택을 비용과 지연의 관점에서 정리한다.

    상세 보기
  8. 80
    L12

    LLM 보안과 운영 방어 계층

    LLM 보안은 자연어 입력, 비결정성, tool 권한 때문에 전통 웹 보안과 다른 공격 표면을 가진다. OWASP LLM Top 10, prompt injection, excessive agency, RAG 위험, 컴플라이언스, defense-in-depth를 운영 관점에서 정리한다.

    상세 보기
  9. 90
    L12

    LLM 운영을 위한 관측성과 평가

    LLM 관측성과 평가는 trace, metric, cost, token, hallucination, eval run을 연결해 변경을 배포해도 되는지 판단하는 운영 체계다. 핵심은 provider 중립 trace와 재현 가능한 평가 자산을 묶어 장애 분석, 회귀 검증, rollback, 개선 loop까지 닫는 것이다.

    상세 보기
  10. 100
    L12

    에이전틱 LLM의 컨텍스트 파이프라인

    에이전틱 LLM 시스템에서 컨텍스트 엔지니어링은 프롬프트 문자열이 아니라 LLM 호출에 들어가는 전체 정보 생명주기를 설계하는 일이다. 선택, 정렬, 압축, 출처 분리, 메모리, 평가를 함께 운영해야 비용과 지연, prompt injection, 근거 오염, 회귀 원인 불명을 줄일 수 있다.

    상세 보기
  11. 110
    L12

    상태 머신으로 LLM 워크플로를 다루기

    상태 머신과 워크플로 그래프가 agent 실행 경로를 제한하고, 디버깅과 테스트, 재시작 복구를 가능하게 만드는 방식을 설명한다. 특히 guard, action, effect 분리와 checkpoint, replay, versioning이 운영 가능한 workflow의 핵심임을 짚는다.

    상세 보기
  12. 120
    L12

    AI 워크플로를 위한 Temporal Durable Execution

    Temporal Durable Execution은 오래 걸리고 자주 실패하는 AI 워크플로를 history와 replay를 기준으로 재개하게 만드는 실행 모델이다. 핵심은 workflow는 결정을 맡고, LLM 호출과 외부 side effect는 activity로 분리하는 데 있다.

    상세 보기
  13. 130
    L12

    Human-in-the-loop AI 워크플로 설계

    Human-in-the-loop은 위험한 AI 실행 경로에 사람의 판단을 삽입하는 구조다. 승인 큐, 위험 기반 게이트, 상태 전이, 감사 로그, 피드백 루프를 함께 설계해야 운영 중 안전장치로 작동한다.

    상세 보기
  14. 140
    L12

    AI 앱의 온톨로지와 역량 모델링

    온톨로지는 AI 애플리케이션에서 도메인 용어와 관계를 명시하는 의미 모델이고, 역량 모델은 업무 수행 능력을 행동 기준과 증거로 구조화한다. 이 구조는 RAG 검색, LLM-as-judge 평가, 권한 정책, SJT 설계에서 같은 기준을 공유하게 만든다.

    상세 보기
  15. 150
    L12

    심리측정으로 설계하는 SJT와 LLM 평가

    Psychometrics는 평가 점수가 안정적이고 적절한 근거를 갖는지 확인하는 관점이고, SJT는 실제 상황 속 판단을 측정하는 문항 구조다. LLM judge를 쓰는 AI 평가 앱에서도 construct, reliability, validity, calibration, drift monitoring이 제품 요구사항이 된다.

    상세 보기