모델 서빙 인프라 비교: 실시간 추론을 어떻게 떠받칠 것인가

모델 서빙 인프라 비교: 실시간 추론을 어떻게 떠받칠 것인가

학습이 끝난 모델을 실제 서비스에 붙이는 순간, 완전히 새로운 문제가 펼쳐집니다. 밀리초 단위 지연, 트래픽 폭증, GPU 비용. 모델 서빙 인프라는 이 세 압력을 어떻게 균형 있게 떠받칠 것인가의 문제이며, 정답은 워크로드 특성에 따라 달라집니다.운영 문제: 추론은 학습과 다른 짐승이다학습은 처리량(throughput) 싸움이지만 온라인 추론은 지연(latency) 싸움입니다. 사용자는 200ms 안에 응답을 기대하는데, 모델은 무겁고 GPU는 비쌉니다. 게다가 트래픽은...
데이터 조직을 처음부터 빌딩하며 배운 다섯 가지 교훈

데이터 조직을 처음부터 빌딩하며 배운 다섯 가지 교훈

3년 전 합류했을 때 회사에는 데이터 담당자가 한 명도 없었다. 의사결정은 임원의 직감과 엑셀 시트 몇 장으로 이뤄졌고, 같은 질문에 부서마다 다른 숫자를 내놓는 일이 흔했다. 나는 데이터 조직을 처음부터 만들어야 했고, 그 과정에서 가장 크게 깨달은 것은 “좋은 분석 도구를 도입하면 문화가 따라온다”는 생각이 완전히 틀렸다는 사실이었다. 이 글은 정답을 제시하려는 것이 아니다. 비슷한 출발선에 선 누군가가 같은 함정을 조금 덜 밟기를 바라며, 내가...
좋은 의사결정은 좋은 결과가 아니다: 결정의 품질을 분리하는 법

좋은 의사결정은 좋은 결과가 아니다: 결정의 품질을 분리하는 법

우리는 결과로 결정을 평가한다. 프로젝트가 성공하면 “역시 옳은 판단이었다”고 말하고, 실패하면 결정을 내린 사람을 탓한다. 그러나 이 직관에는 치명적인 결함이 있다. 좋은 결정도 나쁜 결과를 낳을 수 있고, 형편없는 결정도 운 좋게 성공할 수 있다. 결과만 보면 우리는 운을 실력으로 착각하고, 잘못된 행동을 학습한다. 이 글은 결정의 품질을 결과와 분리해 평가하는 사고 틀을 정리한다. 이는 포커 플레이어와 투자자들이 오래 사용해 온 개념이지만, 기술...
데이터 문화는 도구가 아니라 습관에서 자란다

데이터 문화는 도구가 아니라 습관에서 자란다

많은 조직이 “데이터 기반”이 되겠다고 선언하며 가장 먼저 도구를 산다. 모던 데이터 스택, 셀프서비스 BI, 노트북 환경을 갖추면 사람들이 알아서 데이터를 들여다볼 것이라 기대한다. 그러나 내가 두 회사에서 본 현실은 정반대였다. 도구는 가득했지만 회의는 여전히 “제 느낌엔”으로 시작됐다. 데이터 문화는 라이선스로 구매할 수 없다. 그것은 매일 반복되는 작은 습관과 의식의 누적이다. 이 글은 도구 도입이 아니라 행동 설계의 관점에서...
중앙 플랫폼팀 vs 임베디드 분석가: 어느 쪽도 정답이 아니다

중앙 플랫폼팀 vs 임베디드 분석가: 어느 쪽도 정답이 아니다

데이터 조직을 설계할 때 가장 자주 부딪히는 질문은 구조다. 분석가들을 한곳에 모아 중앙 플랫폼팀을 만들 것인가, 아니면 각 사업부에 분석가를 흩뿌리는 임베디드 모델로 갈 것인가. 양쪽 모두 강력한 옹호자가 있고, 양쪽 모두 처참한 실패 사례가 있다. 나는 두 모델을 모두 운영해 본 두 조직을 가까이서 관찰했다. 결론부터 말하면, 어떤 모델이 옳은가는 잘못된 질문이다. 옳은 질문은 “지금 우리 조직의 성숙도에 무엇이 맞는가”이다. 중앙 플랫폼 모델의 빛과...