Data Infra | 석이's Blog

data-infra Data Contract 실전: Schema Compatibility, Ownership, SLA, Lineage로 깨지지 않는 데이터 파이프라인을 설계하는 법

배경: 데이터 파이프라인 장애의 상당수는 기술 장애가 아니라 계약 부재에서 시작된다

2026-06-18

data-infra CDC Outbox 실전: Debezium, Transaction Log, Idempotency, Ordering으로 데이터 변경 이벤트를 안전하게 발행하는 법

배경: “DB 저장 후 Kafka 발행”은 가장 쉬운 코드이지만 가장 위험한 경계다

2026-06-10

data-infra Kafka Consumer Group 실전: Rebalance, Offset Commit, Lag, Static Membership로 컨슈머를 안정적으로 운영하는 법

배경: Kafka Consumer는 메시지를 읽는 코드가 아니라 운영 계약이다

2026-05-27

data-infra Kafka Log Compaction 실전: cleanup.policy, Tombstone, Dirty Ratio로 상태 복구 가능한 토픽 설계하기

배경: Kafka를 이벤트 버스로만 보면 상태 복구 토픽을 잘못 설계하게 된다

2026-05-12

data-infra Kafka Producer 실전: acks, Idempotence, Transactions, Batching으로 유실 없이 처리량까지 잡는 법

배경: Kafka를 쓴다고 자동으로 안전한 이벤트 발행이 되는 것은 아니다

2026-04-26

data-infra Trino 실전: Join Distribution, Dynamic Filtering, Spill로 느린 Lakehouse 쿼리를 운영 기준으로 다루는 법

배경: 스토리지는 이미 분리했는데, 왜 Lakehouse 쿼리는 여전히 느리고 비쌀까?

2026-04-19

data-infra Apache Pinot 실전: Segment, Partitioning, Star-Tree, Upsert로 초저지연 분석 API를 운영하는 기준

배경: 대시보드는 실시간이어야 하는데, 웨어하우스만으로는 왜 자꾸 늦고 비싸질까?

2026-04-16

data-infra ClickHouse 실전: MergeTree, ORDER BY, PARTITION BY, TTL, Materialized View로 빠른 분석과 운영 비용을 함께 설계하는 법

배경: 분석 쿼리는 느린데, 데이터 플랫폼 비용은 왜 더 빨리 늘어날까?

2026-04-14

data-infra dbt 실전: Incremental Model, Snapshot, Test, Lineage로 분석 테이블을 운영 가능한 상태로 만드는 법

배경: SQL은 많은데, 왜 분석 테이블은 여전히 자주 틀릴까?

2026-04-11

data-infra Apache Flink 실전: Event Time, Watermark, Checkpoint, State TTL로 지연 이벤트를 안정적으로 처리하는 기준

배경: 스트리밍이 어려운 이유는 “실시간”보다 “늦게 오는 데이터”에 있다

2026-04-10

data-infra Apache Spark 성능 실전: AQE, Shuffle, Skew Join, Partition 설계로 느린 배치를 구조적으로 줄이는 법

배경: Spark 작업이 느린 이유는 “클러스터가 약해서”보다 “데이터 이동을 잘못 설계해서”인 경우가 많다

2026-04-04

data-infra Apache Iceberg 실전: Snapshot, Partition Evolution, Compaction으로 데이터 레이크를 운영하는 기준

배경: 데이터 레이크가 느려지는 이유는 파일 포맷보다 “테이블 운영 방식”에 더 가깝다

2026-04-03

data-infra Kafka 재시도와 DLQ 운영 기준: Retry Topic, Poison Pill, 멱등성까지 한 번에 정리

배경: Kafka를 붙였는데도 장애는 왜 더 복잡해질까?

2026-03-30

data-infra Airflow 배치 파이프라인 실전: DAG 멱등성, Backfill, Late Data 운영 기준

배경: 배치는 “한 번 돌면 끝”이 아니라 “다시 돌려도 안 망가져야” 한다

2026-03-25

data-infra Kafka Schema Registry 실전: Avro/Protobuf 스키마 진화와 호환성 운영 기준

배경: 이벤트는 코드보다 오래 살아남고, 그래서 스키마가 사고를 만든다

2026-03-24

data-infra Debezium CDC 실전: 운영 DB 변경 이벤트를 안전하게 스트리밍하는 기준

배경: 왜 CDC를 지금 다시 봐야 할까?

2026-03-23

data-infra Elasticsearch Query DSL 실전: bool, filter, aggregation 제대로 쓰기

왜 Query DSL을 따로 배워야 할까?

2026-03-21

data-infra Kafka 리밸런싱과 운영 장애 대응: 컨슈머가 흔들릴 때 보는 체크포인트

왜 리밸런싱을 이해해야 하나?

2026-03-11

data-infra Elasticsearch 매핑과 인덱스 템플릿 실전: 스키마 폭주를 막는 법

왜 매핑 설계가 중요한가?

2026-03-10

data-infra Kafka 파티션 키 설계와 순서 보장: 같은 이벤트를 같은 흐름으로 보내는 법

왜 파티션 키가 중요한가?

2026-03-02

data-infra Elasticsearch 샤드와 레플리카 설계: 확장성과 가용성의 균형

왜 샤드/레플리카를 따로 배워야 할까?

2026-03-01

data-infra Kafka Consumer Group과 Offset 관리: 중복 처리와 유실을 막는 핵심

왜 이 주제가 중요한가?

2026-02-20

data-infra Elasticsearch 역색인과 Analyzer 실전: 검색 품질을 결정하는 핵심

왜 이 주제가 중요한가?

2026-02-19

data-infra Apache Kafka 기초: 실시간 데이터 스트리밍의 핵심 이해하기

왜 Kafka를 알아야 할까?

2026-02-17

data-infra Elasticsearch 기초: 검색 엔진의 핵심 원리와 실무 활용

왜 Elasticsearch를 알아야 할까?

2026-02-17

data-infra Git workflow 전략 도입

원문: https://blog.naver.com/qoxmfaktmxj/223818156532

2025-04-01

data-infra 도커(Docker)란?

원문: https://blog.naver.com/qoxmfaktmxj/223789574581

2025-03-09

data-infra 서버 이중화

원문: https://blog.naver.com/qoxmfaktmxj/223701240538

2024-12-21

data-infra Web Server와 WAS

원문: https://blog.naver.com/qoxmfaktmxj/222725741877

2022-05-09

data-infra 크로스 도메인 Cross Domain, Cors, Access Control Allow Origin

원문: https://blog.naver.com/qoxmfaktmxj/222705139430

2022-04-21