Data Infra | 석이's Blog

data-infra Apache Flink 실전: Event Time, Watermark, Checkpoint, State TTL로 지연 이벤트를 안정적으로 처리하는 기준

배경: 스트리밍이 어려운 이유는 “실시간”보다 “늦게 오는 데이터”에 있다

2026-04-10

data-infra Apache Spark 성능 실전: AQE, Shuffle, Skew Join, Partition 설계로 느린 배치를 구조적으로 줄이는 법

배경: Spark 작업이 느린 이유는 “클러스터가 약해서”보다 “데이터 이동을 잘못 설계해서”인 경우가 많다

2026-04-04

data-infra Apache Iceberg 실전: Snapshot, Partition Evolution, Compaction으로 데이터 레이크를 운영하는 기준

배경: 데이터 레이크가 느려지는 이유는 파일 포맷보다 “테이블 운영 방식”에 더 가깝다

2026-04-03

data-infra Kafka 재시도와 DLQ 운영 기준: Retry Topic, Poison Pill, 멱등성까지 한 번에 정리

배경: Kafka를 붙였는데도 장애는 왜 더 복잡해질까?

2026-03-30

data-infra Airflow 배치 파이프라인 실전: DAG 멱등성, Backfill, Late Data 운영 기준

배경: 배치는 “한 번 돌면 끝”이 아니라 “다시 돌려도 안 망가져야” 한다

2026-03-25

data-infra Kafka Schema Registry 실전: Avro/Protobuf 스키마 진화와 호환성 운영 기준

배경: 이벤트는 코드보다 오래 살아남고, 그래서 스키마가 사고를 만든다

2026-03-24

data-infra Debezium CDC 실전: 운영 DB 변경 이벤트를 안전하게 스트리밍하는 기준

배경: 왜 CDC를 지금 다시 봐야 할까?

2026-03-23

data-infra Elasticsearch Query DSL 실전: bool, filter, aggregation 제대로 쓰기

왜 Query DSL을 따로 배워야 할까?

2026-03-21

data-infra Kafka 리밸런싱과 운영 장애 대응: 컨슈머가 흔들릴 때 보는 체크포인트

왜 리밸런싱을 이해해야 하나?

2026-03-11

data-infra Elasticsearch 매핑과 인덱스 템플릿 실전: 스키마 폭주를 막는 법

왜 매핑 설계가 중요한가?

2026-03-10

data-infra Kafka 파티션 키 설계와 순서 보장: 같은 이벤트를 같은 흐름으로 보내는 법

왜 파티션 키가 중요한가?

2026-03-02

data-infra Elasticsearch 샤드와 레플리카 설계: 확장성과 가용성의 균형

왜 샤드/레플리카를 따로 배워야 할까?

2026-03-01

data-infra Kafka Consumer Group과 Offset 관리: 중복 처리와 유실을 막는 핵심

왜 이 주제가 중요한가?

2026-02-20

data-infra Elasticsearch 역색인과 Analyzer 실전: 검색 품질을 결정하는 핵심

왜 이 주제가 중요한가?

2026-02-19

data-infra Apache Kafka 기초: 실시간 데이터 스트리밍의 핵심 이해하기

왜 Kafka를 알아야 할까?

2026-02-17

data-infra Elasticsearch 기초: 검색 엔진의 핵심 원리와 실무 활용

왜 Elasticsearch를 알아야 할까?

2026-02-17

data-infra Git workflow 전략 도입

원문: https://blog.naver.com/qoxmfaktmxj/223818156532

2025-04-01

data-infra 도커(Docker)란?

원문: https://blog.naver.com/qoxmfaktmxj/223789574581

2025-03-09

data-infra 서버 이중화

원문: https://blog.naver.com/qoxmfaktmxj/223701240538

2024-12-21

data-infra Web Server와 WAS

원문: https://blog.naver.com/qoxmfaktmxj/222725741877

2022-05-09

data-infra 크로스 도메인 Cross Domain, Cors, Access Control Allow Origin

원문: https://blog.naver.com/qoxmfaktmxj/222705139430

2022-04-21