블로그 홈으로

[MCP6탄] MCP·AI 분석 전 꼭 해야 하는 이벤트 텍소노미와 데이터 거버넌스 점검 방법

지난 시리즈에서는 Mixpanel MCP가 무엇인지,
그리고 분석 자동화를 어떻게 가능하게 만드는지 함께 살펴봤어요.
그런데 실제로 클라이언트들과 일하다 보면 정말 자주 나오는 질문이 하나 있습니다.

“MCP 연결했는데 답이 좀 이상해요. 이거 맞나요?”

그런데 이런 상황의 대부분은 MCP 자체의 문제가 아니에요.

진짜 원인은 따로 있습니다.

바로 AI가 이해할 수 있는 형태로 이벤트 텍소노미와 데이터 거버넌스가 정리되어 있지 않아서에요.

AI는 결국 들어온 데이터를 기반으로 분석합니다.
그래서 데이터 구조가 불명확하거나 이벤트 정의가 제각각이면, AI는 틀린 데이터를 그럴듯하게 해석하게 돼요.

문제는 여기서 끝나지 않아요.
사람이 직접 분석할 때보다 더 빠른 속도로 잘못된 인사이트와 의사결정이 퍼질 수도 있죠.
특히 데이터 거버넌스가 잡혀 있지 않은 상태에서 AI 분석을 시작하면,
“분석 속도”는 빨라졌는데 “판단 정확도”는 오히려 떨어지는 상황이 생길 수 있어요.

그래서 오늘은 AI 분석을 본격적으로 시작하기 전에 왜 거버넌스 진단이 필요한지,
그리고 실제로 어떤 부분을 먼저 점검해야 하는지 체크포인트 6가지를 정리해보려고 합니다.

확인 방법도 어렵지 않아요.
대부분은 Mixpanel에서 이미 제공하는 기능만으로 충분히 진단할 수 있습니다.

ℹ️ 이 글은 마켓핏랩의 Mixpanel MCP 시리즈 6편이에요.
MCP가 무엇이고 한국 조직에서 어떤 의미가 있는지 궁금하시다면 시리즈 1편부터 읽어보세요.

1. MCP·AI 분석에서 데이터 거버넌스가 더 중요한 이유

이벤트 텍소노미와 데이터 거버넌스가 제대로 정리되어 있지 않은 상태에서는,
AI 데이터 분석에서 생기는 문제가 단순히 하나로 끝나지 않아요.
서로 다른 형태의 문제들이 동시에 나타나고, 각각이 만드는 위험도 다릅니다.

그리고 문제 유형마다 필요한 거버넌스 대응 방식도 달라지기 때문에,
먼저 어떤 문제가 발생하고 있는지부터 구분해서 살펴볼게요.

1) 비슷한 이벤트 이름이 만드는 잘못된 AI 분석 (이벤트 텍소노미 부재)

MCP를 통해 AI가 데이터에 접근할 때, AI는 데이터가 어디에서 어떻게 추적되는지 직접 확인하지 않아요.
이벤트 이름과 디스크립션, 즉 이벤트 텍소노미의 메타데이터를 통해 의미를 추정해요.
그래서 Lexicon에 디스크립션이 없으면 AI는 이벤트 이름만 가지고 이게 어떤 이벤트인지를 정의합니다.

예를 들어 signup_v2_final 이라는 이벤트의 디스크립션이 비어 있다고 해볼게요. AI는 이렇게 추정해요.

"signup이라는 단어가 있으니까 가입 이벤트일거야. v2_final이 붙은 걸 보니 두 번째 버전이고 최종본이겠지."

이 추정이 맞을 수도 있지만, 실제로는

  • signup_v2_final 이 더 이상 사용되지 않는 옛날 이벤트일 수도 있고
  • v2_final이 최종본이 아니라 2차 실험의 마지막 시도였을 수도 있고
  • 결제 완료 시점에 발동하는 이벤트일 수도 있어요
[프로젝트 안 이벤트 목록을 검색]
signup (2023년부터 추적 중, 5,234건, 디스크립션 없음)
sign_up (2024년부터 추적 중, 3,128건, 디스크립션 없음)
UserSignUp (2025년 새로 추가, 891건, 디스크립션 없음)
→ AI:
“셋 다 가입 같은데 디스크립션이 없네...
이름만 보고 셋 중 뭘 골라야 하지?”

→ AI 결정: 가장 최근 이벤트인 UserSignUp 선택

→ 답변: “이번 주 가입자는 891명입니다.”


그래서 AI가 이벤트 이름만 보고 의미를 추측하기 시작하면,
실제 비즈니스 맥락과 다르게 해석될 가능성이 항상 존재해요. 이벤트 이름이 같다고 해서,
AI가 우리 조직에서 사용하는 진짜 의미까지 정확히 이해하고 있다는 보장은 없기 때문입니다.

2) 잘못된 AI분석: 팀마다 다른 뜻으로 쓰는 용어

이건 데이터 자체의 문제라기보다 팀 간 용어 합의가 안된 문제예요.
마케팅팀의 Activation과  프로덕트팀의 Activation이 서로 다른 정의를 가지고 있을 수 있어요.

예를 들면 Activation을 팀마다 이렇게 정의할 수 있죠.

  • 마케팅팀은 회원가입 후 7일 내에 한 번이라도 로그인한 사용자
  • 프로덕트팀은 가입 후 핵심 기능을 3회 이상 사용한 사용자
  • 재무팀은 결제까지 완료한 사용자

이 상태에서 AI에게 "이번 주 Activation 활성사용자는?" 이라고 물으면, AI는 임의로 정의를 선택해요.
대시보드에서 activation을 검색해 해당 정의를 가져와서 분석할 수도 있고, 일반적인 활성화 정의를 찾아 리포트를 그릴 수도 있어요.

결과적으로 같은 질문을 마케팅팀이 던지면 12,000명이 나오고, 프로덕트팀이 던지면 3,400명이 나오는 상황이 됩니다.

이런 문제는 사실 AI를 도입하기 전에는 각 팀이 자기 회의에서만 각자 개별 정의로 해당 지표를 정의해 사용하다가 AI로 모두가 같은 도구로 특정 용어를 호출하니 충돌이 가시화되는 것이라고 보시면 됩니다.

3) 잘못된 AI분석: 데이터에 문제가 있어도 분석을 계속하는 AI

기존의 전통적인 분석 환경에서는 데이터에 문제가 생기면 보통 분석 자체가 멈추는 경우가 많았어요.
쿼리 에러가 발생하거나, 결과가 비어 있거나, 데이터 불일치 알림이 뜨는 식이었죠.

설령 명확한 에러가 보이지 않더라도 분석이 자연스럽게 막히기 때문에,
분석가는 “어? 뭔가 이상한데?” 하고 한 번 더 확인할 기회를 가질 수 있었어요.

그런데 AI는 뭔가 이상해도 멈추지 않아요. 데이터에 문제가 있어도 멈추지 않고 어떻게든 답을 도출합니다…

이게 조용한 실패(silent failure) 라고 불리는 새로운 종류의 분석 위험이예요.
답이 없는 것이 사실인데 틀린 답이 그럴듯한 모습으로 도착하는 것이죠.
그래서 사용자는 그 답이 틀렸다는 것을 분석을 진행하다가 알게 되거나 검증하지 않으면 알아채지 못하고 의사결정에 반영해버리는 문제 상태가 되죠.

위 3가지 이슈는 드러나는 모양도, 해결책도 모두 다릅니다.그렇지만 모두 데이터 거버넌스가 정리되지 않았기 때문에 발생합니다.지금부터 이벤트 텍소노미, 거버넌스가 정리되지 않은 상태에서 어떻게 대응해야 할지를 말씀 드릴게요.

2. 우리 데이터는 Mixpanel MCP·AI 분석해도 될까? — 이벤트 텍소노미 진단 6가지

거버넌스 점검을 시작하기 전, 우리 데이터가 어느 단계에 있는지 확인해보세요.
아래 6개 중 하나라도 해당된다면 AI분석 전 데이터 거버넌스, 이벤트 텍소노미 정리가 필요한 상태예요.

# 진단 질문 YES면
1 같은 행동에 여러 이벤트가 있다
(예: Purchase_Completed vs OrderPurchased)
명명 규칙 부재
2 Lexicon 안에 디스크립션이 비어 있는 이벤트가 많다 의미 문서화 부재
3 팀마다 핵심 지표(활성화, DAU 등)의 정의가 다르다 정의 합의 부재
4 핵심 이벤트의 오너가 누구인지 명확하지 않다 오너십 부재
5 지표의 의미를 두고 정렬 회의가 자주 열린다 공통 언어 부재
6 AI가 준 답을 확실히 하기 위해 수동 쿼리로 다시 돌려본다 신뢰 기반 부재

실제로 클라이언트들과 함께 진단을 진행해보면, 대부분의 조직이 이 5~6가지 항목에 거의 모두 해당하는 경우가 많아요.

그리고 이건 한국 조직만의 문제도 아닙니다. 데이터 분석 환경은 빠르게 커졌는데,
이벤트 구조나 거버넌스를 지속적으로 관리하는 체계는 그 속도를 따라가지 못한 경우가 많거든요.

다만 중요한 건, 현재 거버넌스 상태가 이 체크리스트에 대부분 해당하더라도 너무 어렵게 생각할 필요는 없다는 점이에요. 생각보다 많은 부분이 기존 데이터와 Mixpanel 기능만으로도 충분히 개선 가능합니다.

3. AI 분석을 위해 이벤트 텍소노미 거버넌스 바로 잡기

거버넌스라고 하면 전사 시스템 구축이 떠올라 부담스러울 수 있지만 몇가지만 체크해도 AI의 분석 퀄리티를 올릴 수 있는 데이터 환경을 구축할 수 있어요.
마켓핏랩에서 클라이언트 도입 초기에 함께 점검하는 항목들을 특별히 공개할게요 🙂

3-1) 핵심 이벤트와 지표를 정의하기

모든 이벤트를 한 번에 정리하려고 하지 마세요. 핵심 이벤트와 지표 용어 5~10개부터 시작해보세요.

예를 들어

  • User Signed Up (가입)
  • Activation Event (활성화 - 정의 확인)
  • Subscription Started (결제 시작)
  • Feature A Used (핵심 기능 사용)

활성화 같은 단어는 회사마다, 팀마다 정의가 다를 수 있으니,
정의를 한 줄로 적어 합의하는 것이 첫 번째 거버넌스 작업이에요.

3-2) 정의한 이벤트와 지표의 의미를 Lexicon에 적기

이벤트 정의를 머릿속에만 두면 거버넌스가 아니에요.
믹스패널 Lexicon에 디스크립션을 작성해두세요. 이 이벤트가 무엇인지 AI가 읽고 정확한 의미를 알게 됩니다.

좋은 디스크립션 예시:

❌ "User signed up"

✅ "회원가입 이벤트 - 신규 사용자가 회원가입 폼을 제출하고 이메일 인증까지 완료한 시점에 발생. 미인증 가입 미포함. 2024년 3월부터 셋업."

두 번째와 같이 적어두면 AI가 언제, 어떤 조건, 어떤 예외가 있는지 모두 알 수 있어요.

3-3) 주요 이벤트의 오너와 팀 명확히하기

이벤트마다 오너 한 명을 지정하세요. 믹스패널 렉시콘에서 이벤트별 오너를 지정할 수 있어요.

  • 이벤트 정의의 변경 권한을 주고 주기적으로 디스크립션을 최신 상태로 유지하게 해주세요
  • 의문이 생겼을 때 팀이 물어볼 수 있는 기준점과 컨택 포인트가 됩니다.

오너십이 없는 이벤트는 서서히 지저분해져요. 누구나 손댈 수 있고, 누구도 책임지지 않으니까요.
Lexicon 안에 오너 필드를 채우면 오랜 기간 클린 데이터로 유지됩니다.

3-4) 이벤트 변경은 Event Approval로 사전 검토하기

새 이벤트를 추가하거나 기존 이벤트의 정의를 바꾸기 전에, 믹스패널  Event Approval 기능을 통해 사전 검토해보세요.

Event Approval은 Mixpanel 프로젝트로 새 이벤트가 들어올 때 기본적으로 숨김 처리해 올리고 관리자에게 알림을 보내 검토 후 공개로 전환하는 기능이에요.

이 기능을 사용하면 누군가 signup 이라는 이벤트가 있는 줄 모르고 sign_up 을 새로 추가해 생기는 중복 이벤트가 여러건으로 생기거나 잘못 트래킹된 이벤트가 검증되지 않은 채 분석에 섞이는 걸 막을 수 있어요.

📚 Mixpanel Event Approval 공식 가이드

이벤트 승인(Event Approval)은 렉시콘 > Data Rule > Event Approval에서 토글 설정하실 수 있어요

이벤트 승인(Event Approval)은 렉시콘 > Data Rule > Event Approval에서 토글 설정하실 수 있어요

3-5) 이벤트 오너가 텍소노미와 디스크립션 정의를 주기적으로 점검하기

제품이 진화하면 이벤트의 의미도 진화해요. Activation의 정의가 1년 전과 지금이 같을 리 없죠. 그런데 Lexicon의 디스크립션이 그대로 남아 있으면, AI는 옛날 정의로 지금 데이터를 해석해요.

분기마다 한 번, 핵심 이벤트의 디스크립션을 검토하는 30분만 가져보세요.
Data Standards와 Lexicon 메타데이터를 함께 활용하면, 이름, 디스크립션,오너를 한꺼번에 업데이트할 수 있어요.

3-6) Session Replay와 함께 점검하기

마지막!  데이터를 문서화하는 것과 데이터를 직접 보는 것은 다른 일이에요.

우리가 의도한대로 데이터가 트리거 되고 추적될 수 있을까요?
믹스패널 Session Replay를 확인해보세요.
Lexicon과 이벤트 미리보기 안에서 실제 사용자 영상이 자동으로 연결되어,
AI가 요약해주는 "이런 행동이 있었다"라는 텍스트를, 실제 사용자의 영상을 보며 일치하는지 30초 만에 검증할 수 있어요.

혹시 세션 리플레이라는 기능이 무엇인지, 어떻게 설정해야할지를 모르겠다면 이 포스팅을 참고해주세요

세션 리플레이 설정은 아래 화면 Setting > Organization > Session Replay에서 하실 수 있어요.

4. 데이터 점검과 정비, 어디서부터 시작할까

위 6가지를 한 번에 다 하려고 하지 마시고 이렇게 시작해보세요. 저희가 클라이언트에게 자주 권하는 순서는 이래요.

1주차
핵심 이벤트 5~10개 식별 (① 정의)
2주차
Lexicon에 디스크립션 작성 (② 문서화)
3주차
오너 지정 + Event Approval 활성화 (③ 오너십 + ④ 변경 검토)
4주차
Session Replay 검증 흐름 셋업 (⑥ 검증)
이후
분기별 정의 리뷰 사이클 정착 (⑤ 주기적 검토)

보통은 아주 넉넉하게 한 달이면 핵심 거버넌스가 잡혀요. 4주 면 AI가 주는 답을 재검증 없이 의사결정에 쓸 수 있는 환경이 만들어집니다!

좋은 답을 받고 싶다면 좋은 데이터부터

Garbage in Gabage out! 유명한 말이죠.좋은 질문 전에 좋은 데이터가 있어야해요.
그 다음부터 질문을 하고 답을 찾을 수 있으니까요.

좋은 데이터는 양이 많은 데이터가 아니에요.
이벤트 텍소노미가 잡혀 있고, 정의가 명확하고, 오너가 있고, 의미가 문서화된 데이터예요.
그런 데이터 위에서 AI는 해석을 하고, 지저분한 데이터 위에서는 할루시네이션으로 왜곡된 데이터가 출력돼요.

중요한 건 얼마나 빠르게 시작하느냐보다, 시작한 이후에도 흔들리지 않는 거버넌스를 만드는 거예요.
결국 그 기반이 있어야 AI 분석도 더 안정적으로, 더 크게 확장될 수 있습니다.

  • 우리 조직 데이터 거버넌스가 어느 단계에 있는지 진단받고 싶다면
  • 거버넌스 점검에 대한 어드바이스가 필요하다면
  • AI 분석을 도입하면서 거버넌스를 함께 설계하고 싶다면

커피챗을 신청해 주세요.

📩 문의 이메일: solutions@mfitlab.com, nicky@mfitlab.com

거버넌스가 잡힌 후, Mixpanel MCP·AI 분석을 조직의 워크플로로 확장하는 단계는 시리즈 4편 — 분석을 시스템으로 만드는 3가지 자동화 스킬에서 다뤄요. 글로벌 팀들의 실제 적용 사례는 시리즈 7편에서 만나보실 수 있어요.

No items found.
공유하기
Nicky(강보라)
Product Analyst
IT 스타트업의 그로스 마케팅과 PO을 거치며, 15년 이상 비즈니스의 성장 과제를 다뤄왔습니다. 현재 마켓핏랩 솔루션즈에서 Head of Operation이자 컨설팅 디렉터로 컨설팅·엔지니어링팀을 이끌고 있습니다. 엔터프라이즈 고객이 PA, MMP, CRM 툴과 데이터를 활용해 성장을 설계할 수 있도록 돕습니다.
KPI 기반 비즈니스 질문,
솔루션즈 AI가 만들어드립니다
마케터와 데이터 분석가를 위한 KPI 기반 가설/질문 생성기
인사이트를 빠르게 확보하세요!
무료로 질문 생성하기
일시 |
세미나가 종료되었습니다.
신청하기신청하기
** rich text 안에 form 작동 시키기 **