/ 전체 아티클

전체 아티클

AI·데이터·인프라까지, e-wikidversity의 모든 기술 아티클을 한곳에서 시간순으로 모았습니다.

60
아티클
전체 60개
정렬 ·
— 모든 아티클
데이터 엔지니어링읽기 5분

레이크하우스 아키텍처 설계: 데이터 레이크와 웨어하우스를 하나로

데이터 레이크의 유연성과 웨어하우스의 신뢰성을 결합한 레이크하우스를 설계하는 원칙과 단계를 실무 관점에서 정리합니다.

amond · 06.09
데이터 엔지니어링읽기 5분

Kafka로 구축하는 실시간 스트리밍 파이프라인 입문

메시지 브로커 Kafka의 핵심 개념부터 프로듀서, 컨슈머, 토픽 설계까지 실시간 데이터 파이프라인을 단계별로 만들어 봅니다.

amond · 06.08
데이터 엔지니어링읽기 6분

Airflow로 데이터 파이프라인 오케스트레이션 제대로 하기

Airflow의 DAG, 태스크 의존성, 스케줄링 원리를 이해하고 안정적인 워크플로 오케스트레이션을 구축하는 방법을 설명합니다.

amond · 06.06
데이터 엔지니어링읽기 5분

dbt로 데이터 변환 모델링하기: 분석 엔지니어링의 표준

SQL 기반 변환 도구 dbt로 모듈화된 데이터 모델을 만들고 테스트와 문서화를 자동화하는 분석 엔지니어링 워크플로를 소개합니다.

amond · 06.05
데이터 엔지니어링읽기 4분

ETL vs ELT: 어떤 데이터 통합 방식을 선택해야 할까

변환을 적재 전에 할지 후에 할지에 따라 달라지는 ETL과 ELT의 구조, 비용, 적합한 상황을 실무 기준으로 비교 분석합니다.

amond · 06.04
데이터 엔지니어링읽기 5분

스키마 진화 관리: 깨지지 않는 데이터 계약 만들기

데이터 스키마가 시간에 따라 변하는 것은 필연입니다. 하위 호환성을 지키며 스키마를 진화시키는 전략과 도구를 정리합니다.

amond · 06.02
데이터 엔지니어링읽기 5분

Spark 성능 튜닝 실전: 셔플과 스큐를 잡는 방법

느린 Spark 잡의 원인 대부분은 셔플과 데이터 스큐입니다. 파티셔닝, 조인 전략, AQE를 활용한 실전 튜닝 기법을 정리합니다.

amond · 06.01
데이터 엔지니어링읽기 5분

데이터 파이프라인 관측성: 신뢰를 만드는 모니터링 체계

파이프라인이 돌아간다고 데이터가 정확한 것은 아닙니다. 신선도, 양, 분포, 스키마, 계보를 아우르는 데이터 관측성 체계를 설명합니다.

amond · 05.30
데이터 엔지니어링읽기 5분

배치에서 스트리밍으로: 6개월간의 전환 회고

일 1회 배치로 운영하던 분석 파이프라인을 준실시간 스트리밍으로 전환한 6개월의 과정과 시행착오, 그리고 배운 교훈을 공유합니다.

amond · 05.29
총 60개 중 9개 표시