데이터의 연금술, DMP
제13화
발행일: 2025년 06월 05일
"이 광고는 누가 봐야 하는가?"
그 질문은 며칠 동안 알렉스의 머릿속을 떠나지 않았다. 팀 전체가 새로운 과제에 대한 논의로 들끓었다. ‘사용자’를 어떻게 이해하고, 그 정보를 어떻게 경매에 활용할 것인가. 그것은 이제 팀의 가장 중요한 화두가 되었다.
데이비드 첸은 이 문제를 해결하기 위한 새로운 프로젝트 팀의 구성을 발표했다.
“우리는 이제 단순히 거래소만 운영하는 팀이 아니다. 인터넷의 방대한 데이터 속에서 의미 있는 가치를 찾아내는 연금술사가 되어야 한다. 이 프로젝트의 이름을 ‘데이터 관리 플랫폼(Data Management Platform)’이라고 명명한다.”
DMP.
알렉스는 그 새로운 약어를 자신의 노트에 적었다. 광고 거래소(Ad Exchange), 수요 측 플랫폼(DSP), 공급 측 플랫폼(SSP)에 이어, 생태계의 네 번째 핵심 구성 요소가 될 운명을 지닌 단어였다.
DMP 팀의 첫 회의. 화이트보드 앞에는 사라와 알렉스를 포함한 핵심 엔지니어 몇 명이 모였다.
사라가 논의의 시작을 열었다.
“좋습니다, 여러분. 우리가 해야 할 일은 명확합니다. ‘익명의 사용자 A’에게 의미 있는 꼬리표(Tag)를 붙여주는 겁니다. 예를 들면, ‘30대 남성’, ‘자동차 애호가’, ‘최근 스키 여행 검색’ 같은 것들이죠.”
한 엔지니어가 질문했다.
“그 꼬리표를 어떻게 만듭니까? 사용자의 이름이나 이메일 같은 개인정보를 사용할 수는 없지 않습니까?”
“당연하죠.” 사라가 즉시 대답했다. “개인정보 보호는 우리의 절대 원칙입니다. 우리는 특정 개인을 식별하는 것이 아니라, 특정 ‘행동 패턴’을 보이는 익명의 그룹을 만들어내는 겁니다. 우리는 그것을 ‘세그먼트(Segment)’라고 부를 겁니다.”
그녀는 화이트보드에 그림을 그리기 시작했다.
-
데이터 수집 (Data Collection):
- “우선, 사용자의 비식별 행동 데이터를 수집해야 합니다. 예를 들어, 익명의 사용자
ID-123
이car-review.com
을 방문하고,ford-suv-page.html
을 읽고,google.com
에서 ‘SUV 연비 비교’를 검색했다는 기록들이죠.”
- “우선, 사용자의 비식별 행동 데이터를 수집해야 합니다. 예를 들어, 익명의 사용자
-
데이터 분류 및 분석 (Data Classification & Analysis):
- “수집된 데이터를 분석해서 규칙을 만듭니다. ‘만약 어떤 사용자가 3개 이상의 자동차 관련 사이트를 방문하고, 자동차 관련 키워드를 5번 이상 검색했다면, 그 사용자를 [자동차 관심 그룹] 세그먼트에 포함시킨다’ 와 같은 규칙을요.”
-
세그먼트 생성 및 저장 (Segment Creation & Storage):
- “이 규칙에 따라, 사용자
ID-123
에게는 [자동차 관심 그룹]이라는 꼬리표가 붙게 됩니다. 이 정보는 거대한 데이터베이스에 저장되죠.ID-123: [자동차 관심 그룹], [여행 잠재 고객]
이런 식으로요.”
- “이 규칙에 따라, 사용자
알렉스는 사라의 설명을 들으며 DMP의 본질을 깨달았다. 그것은 흩어져 있는 수십억 개의 모래알 같은 데이터 속에서, ‘자동차’라는 키워드를 가진 모래알들만 골라내어 하나의 유리병에 담는 작업과 같았다.
“그럼 이 세그먼트 정보는 어떻게 사용되는 겁니까?” 알렉스가 물었다.
“아주 좋은 질문이에요. 다시 RTB 경매 상황으로 돌아가 보죠.”
사라는 이전에 그렸던 RTB 흐름도 옆에 DMP를 추가했다.
“우리 애드 익스체인지가 DSP에게 입찰 요청을 보낼 때, 이제는 단순한 페이지 정보만 보내는 게 아닙니다. DMP에 저장된 세그먼트 정보도 함께 보내주는 거죠.”
그녀는 입찰 요청 데이터 예시를 수정했다.
{ "url": "...", "size": "...", "user_segments": ["자동차 관심 그룹", "30대 남성 추정"] }
“이 정보를 받은 포드의 DSP는 어떻게 반응할까요?”
알렉스는 즉시 답을 알 수 있었다.
“‘자동차 관심 그룹’이라는 확실한 정보가 있으니, 이전보다 훨씬 더 자신 있게, 더 높은 가격으로 입찰할 겁니다. 반면 나이키의 DSP는 이 사용자가 자신들의 타겟이 아니라는 것을 명확히 알고 입찰을 포기하겠죠.”
결과는 명백했다. 광고는 적합한 사람에게 전달되고, 광고주는 예산을 효율적으로 사용하며, 매체사는 타겟팅된 광고에 더 높은 단가를 책정하여 수익을 높인다. 사용자 역시 자신과 무관한 광고 대신 유용한 정보를 얻을 가능성이 커진다.
그것은 모두가 승리하는 게임이었다.
데이비드는 알렉스에게 첫 번째 DMP 관련 과제를 주었다.
“알렉스, 자네는 사용자 ID와 세그먼트 정보를 저장할 데이터베이스 스키마(schema)를 설계해보게. 수십억 명의 사용자, 수만 개의 세그먼트, 그리고 이 모든 정보가 0.1초 안에 조회될 수 있어야 한다는 조건을 만족시켜야 할 거야.”
다시 한번, 그는 거대한 시스템의 가장 근본적인 뼈대를 설계하는 임무를 맡았다. Latency와의 전쟁이 끝난 지금, 알렉스는 인터넷의 방대한 데이터를 길들이는 새로운 시대의 연금술사가 되어가고 있었다.