개인정보 규제는 더 이상 법무팀만의 영역이 아니다. GDPR과 국내 개인정보보호법은 데이터가 어디에 저장되고 어떻게 흐르며 누가 접근하는지를 기술적으로 통제할 것을 요구한다. 이는 본질적으로 데이터 거버넌스의 문제다. 규제 대응을 거버넌스 체계로 풀어내지 못하면 매번 수작업으로 감사에 끌려다니게 된다. 규제가 요구하는 핵심 의무 처리 기록(RoPA): 어떤 개인정보를 무슨 목적으로 어떻게 처리하는지 문서화 정보주체 권리: 열람, 정정, 삭제(잊힐 권리), 처리 정지 요청 대응...
대시보드의 매출 숫자가 갑자기 절반으로 떨어졌을 때, 가장 먼저 던지는 질문은 “이 숫자가 어디서 왔는가”다. 데이터 리니지는 데이터가 원천 시스템에서 변환을 거쳐 최종 산출물에 이르는 전체 경로를 추적하는 기술이다. 리니지가 없으면 장애 원인 파악은 추측에 의존하고, 변경의 파급 효과는 배포 후에야 드러난다. 리니지가 답하는 질문들 이 컬럼을 바꾸면 어떤 리포트가 영향을 받는가 (영향 분석) 이 지표의 이상값은 어느 단계에서 발생했는가 (근본 원인...
데이터 접근 권한을 개인별로 일일이 부여하다 보면 곧 통제 불능 상태에 빠진다. 누가 어떤 데이터에 왜 접근할 수 있는지 아무도 설명하지 못하게 되고, 퇴사자의 권한이 몇 달째 살아 있기도 한다. 역할 기반 접근통제(RBAC)는 권한을 개인이 아니라 역할에 묶어 이 혼란을 구조화한다. RBAC의 기본 모델 RBAC의 핵심은 사용자와 권한 사이에 “역할”이라는 계층을 두는 것이다. 사용자는 역할에 배정되고, 권한은 역할에 부여된다. 마케팅 분석가라는 역할에...
데이터 파이프라인이 깨지는 가장 흔한 원인은 코드 버그가 아니라 “말없는 스키마 변경”이다. 업스트림 팀이 컬럼 이름을 바꾸거나 타입을 변경하면, 그 사실을 모르는 다운스트림 파이프라인이 조용히 잘못된 값을 흘려보낸다. 데이터 계약(Data Contract)은 생산자와 소비자 사이의 데이터에 대한 명시적 약속을 코드로 표현해 이 문제를 막는다. 왜 지금 데이터 계약인가 마이크로서비스와 데이터 메시 환경에서 데이터 생산과 소비는 서로 다른 팀에 분산된다....
많은 조직이 데이터 거버넌스 정책 문서를 만들지만, 정작 그 정책이 일상 업무에서 작동하지 않는다. 정책과 현실의 간극을 메우는 것은 도구가 아니라 사람과 책임 구조다. 거버넌스 운영 모델은 누가 어떤 데이터 의사결정을 내리고 실행하는지를 명확히 하는 조직 설계다. 왜 운영 모델이 실패하는가 거버넌스가 실패하는 전형적 패턴이 있다. 너무 중앙집중적이면 모든 결정이 한 팀에 몰려 병목이 되고 현업의 외면을 받는다. 반대로 너무 분산적이면 표준이 없어 부서마다 제각각의 데이터를...