영화를 구분하는 76,897 가지 방법

[요약] 넷플릭스가 분류하는 영화 장르는 역 엔지니어링을 통해 밝혀진 것만 76,897개. 그 목적은 단순한 분류가 아니라 개인화 추천이다. 아직은 완벽하지 않지만, TV 시대의 시청률은 뉴미디어 시대의 개인화로 진화하고 있다. 하지만 아직 한국의 서비스들은 갈 길이 멀다. 컨텐트 라이브러리, 요금제, 개인화 기술의 전략적 삼위일체가 필요하다.

・      ・      ・

애틀랙틱(The Atlantic)의 선임 편집자인 알렉시스 매드리걸(Alexis Madrigal)과 그의 동료들이, 역 엔지니어링을 통해, 넷플릭스가 컨텐트를 분류하는 세부 장르-넷플릭스 내부적으론 ‘알트장르(altgenres)’라 부르는-의 종류가 무려 76,897가지나 된다는 사실을 밝혀냈다. 예를 들면 이런 것들이다.

  • 악마 같은 아이가 나오는 컬트 공포 영화
    (Cult Evil Kid Horror Movies)
  • 유럽 배경의 60년대 영국 공상과학/판타지물
    (British set in Europe Sci-Fi & Fantasy from the 1960s)
  • 비평가들에게 호평받은 감동적 패배자 영화
    (Critically-acclaimed Emotional Underdog Movies)
  • … 그리고 나머지 76,894개 장르.

엄청난 가짓수도 놀랍지만, 도대체 이런 문구의 조합을 어떻게 만들어 낼 수 있는 것일까. 매드리걸이 이 넷플릭스 문법 구조도 밝혀냈다. (스프레드시트에 정리까지 해놓았다.)

  • 지역(Region) + 수식어(Adjectives) + 장르(Noun Genre) + 원작(Based On…) + 배경(Set In…) + 시대(From the…) + 주제(About…) + 나이(For Age X to Y)

이외에도 배우, 감독, 제작자 요소도 따로 있으니, 8만이 아니라 무한대 언어 세계를 창조할 수 있겠다. 매드리걸 패들이 ‘넷플릭스-장르 제조기’까지 만들어 놓았으니, 기사를 참조하라. 그 제조기의 ‘Gonzo’ 버튼을 눌러봤더니 다음과 같은 극단적 장르까지 만들어 준다.

  • 기분 좋고 시각적으로 인상적인 호주/뉴질랜드 배경의 재회 연인에 대한 소설 원작 공상 과학 영화
    (Feel-Good Visually Striking Sci-Fi Movies Based on a Book Set in Australia/NZ About Reunited Lovers)

물론 이런 장르가 실제 존재하진 않는다. 그러나 마음만 먹으면-로직만 검증된다면- 앞으로도 없으리란 법은 없다. 넷플릭스의 개인화 조직 책임자인 토드 옐린(Todd Yellin)에 따르면, 넷플릭스의 시스템에는 매드리걸이 찾아낸 것보다 훨씬 더 많은 데이터와 로직이 존재한다고 한다. 76,897개라는 어마어마한 숫자조차도 그 한계를 규정하진 못한다는 얘기다.

이런 문법을 만들어 내는 어휘는, 한때 ‘양자[quantum]’라는 은유적 표현으로, 지금은 ‘마이크로태그(microtag)’라 불리는 1,000여 개의 태그 집합이다. 이 태깅 작업은 대부분 영화업 관련자들인 잘 훈련된 40여 명의 재택 근무자들의 손길로 이루어진다. 예를 들어 ‘모던 패밀리’를 직접 시청하고, 넷플릭스의 정해진 스프레드시트에 이런 식으로 정리한다.

  • 코미디: 기발한[quirky]
  • 유머: 약간 어두운[light dark]
  • 톤: 웃긴[humorous], 무례한[irreverent], 진심 어린[heartfelt]
  • 필 (타이 버렐): 바보 같은[silly], 유치한[childish], 사랑스러운 멍청이[lovable dumbass]
  • 클레어 (줄리 보웬): 통제력 있는[controlling], 독단적인[assertive]
  • 제이 (에드 오닐): 무뚝뚝한[surely], 우두머리[alpha dog]

게다가 단순히 형용사적 단어 선택을 하는 것이 아니다. 많은 값이 계량화된다. 예를 들어, 모든 영화는 ‘낭만’ 점수를 1점에서 5점까지 매긴다. 이런 정교한 마이크로태그를 바탕으로 넷플릭스의 ‘알트장르’들이 만들어진다.

넷플릭스가 이렇게까지 장르 세분화에 집착하는 이유는 당연히 ‘개인화’ 때문이다. 최대한 가입자가 보고 싶어하는 컨텐트를 추천하고, 이를 만족스럽게 소비하도록 한다면, 다음 달에도 이 가입자는 계속 서비스 계약을 유지할 것이다. 넷플릭스에선 가입자를 묶어두기 위한 비열한 꼼수는 없다. 언제든 해약할 수 있고, 언제든 다시 가입할 수 있다. 오로지, 컨텐트로만 승부한다.

넷플릭스은 시청률을 발표한 적이 없다. 광고 모델도 아니고, 컨텐트를 개별 판매하는 모델도 아니므로, 얼마나 많이 봤느냐가 중요하지 않은 것이다. 가입자를 지속해서 유지하는 것, 그리고 그런 가입자 수를 늘리는 것, 그것이 넷플릭스의 지상 목표이다. 말하자면, 올드미디어 TV 시대의 두리뭉실한 시청률이 뉴미디어 인터넷 스트리밍 시대의 개인화로 진화하고 있는 셈이다.

그러므로 ‘개인화’는 넷플릭스엔 필수적인 덕목이다. 개인화는 오로지 컨텐트 추천에만 집중되어 있다. 더 나아가서는, 그런 개인화에 딱 맞는 최적의 컨텐트를 스스로 제작하기까지 한다. 심지어 비평가들의 혹평을 받은 ‘헴록 그로브’ 같은 작품 제작을 결정하기도 한다. 직관이나 감이 아니라, ‘개인화’라는 데이터에 기초한 컨텐트 전략까지 가능하다는 자신감의 표현일 것이다. 이런 개인화 전략은 철저히 컨텐트 소비의 선순환 구도에 맞춰져 있다.

하지만 어떤 사람들에게는 개인화가 만병통치약처럼 여겨진다. 소비자의 행태를 통해 취향과 심리까지 분석해 다른 상품의 구매율까지도 극대화할 수 있다는 것이다. 유행하는 빅데이터의 이면에는 이런 마케터의 꿈이 녹아있다. 이런 무지갯빛 사탕은 컨텐트를 장사하는 사업자들에게도 달콤한 유혹이다.

예를 들어 판도라의 경우를 보자. 판도라에도 ‘뮤직 게놈 프로젝트‘라는 유명한 음악 추천 로직이 있다. 하지만 판도라는 여기서 멈추지 않는다. 판도라의 중요한 수익 모델인 광고에도 개인화 로직이 적용된다. 이런 식이다.

예를 들어, 차기 연방 선거 기간 동안, 컨트리 음악 그룹, 스탠드업 코미디언이나 크리스천 밴드를 듣는 판도라 사용자는 공화당 의원 후보의 광고를 듣거나 보게 될 것이다. 힙합 노래, 또는 베를린 필하모닉 같은 클래식 그룹을 듣는 사람들은 민주당 후보 광고를 듣게 될 것이다.

하지만 그 꿈을 좇는 것보다는 컨텐트를 추천하는 로직의 정확도를 높이는 것 자체가 아직도 도전이다. 넷플릭스는 초기엔 별점 예측률을 10% 높이는 것을 목표로 백만 달러를 걸고 ‘넷플릭스 프라이즈’ 공모를 했었다. 우승팀을 뽑아 시상했고, 소스 코드도 받았지만, 별점 시스템 자체는 한계가 있었다. 사람들이 좋아한다고 밝히는 것과 실제 당장 보고 싶어 하는 것에는 괴리가 있다. 결국, 거의 모든 사용자 시청 행태를 분석하고, 내부적으로 ‘소비자 데이터 과학’이라 부르는 A/B 테스트 기법을 통해 꾸준히 ‘개인화’ 시스템을 개선해 왔다. (이에 대한 내용은 넷플릭스 테크 블로그에 자세히 기술되어 있다. 파트1, 파트2)

그렇게 해서 넷플릭스는 추천에 의한 시청을 75% 정도까지 끌어 올린 것으로 자체 분석하고 있다. 컨텐트 소비 행태를 같은 상품인 컨텐트 추천에 연결하는 것은 그나마 소비 유형의 유사성 때문에 쉽게 받아들여질 수 있다. 하지만 이것이 판도라의 예처럼 과연 광고 유형과도 실질적으로 효과적인 연결 고리를 찾아낼 수 있을까. 예를 들어, 만약에 얼마 전 내한했던 (환상적인!) 베를린 필 연주회에 참석했던 어르신들이 연주회장 입구에서 민주당 포스터를 봤다면 좋아했을까. 물론 확률적 기저율로만 보자면, 흠잡을 때 없는 로직일 것이다. 하지만 소비자들이 광고를 대하는 인식이나 태도는 컨텐트의 소비와는 사뭇 다르게 부정적이다. 말하자면, 민주당 포스터가 아니라 힙합 음반 팝업 매장을 봤다면 그리 거부감이 있겠는가.

개인화는 아직 완벽하지 않다. 매드리걸이 찾아낸 “페리 메이슨 미스터리”-넷플릭스 알트장르 중, 비교적 덜 유명한 50년대 드라마 ‘페리 메이슨’ 관련 장르가 비정상적으로 많이 발견되는 오류-를, 옐린은 시스템이 복잡해질수록 발생할 수 있는, 예상 밖의 세렌디피티(serendipity) 효과로 포장한다. 꿈보단 해몽이다.

이젠 한국으로도 눈을 돌려보자. 사실, 한국의 거의 모든 뉴미디어 컨텐트 서비스들은 크든 작든 명목상 ‘개인화’ 서비스를 하지 않는 곳이 없다 해도 과언이 아니다. 최소한 열심히 개발 중이라는 얘기는 할 것이다. 그 모든 서비스를 다 확인할 수 없으니, 익숙한 서비스인 호핀에 대해 살펴보자.

호핀을 운영 중인 SK플래닛은 오래전(SK텔레콤 시절)부터 개인화 기술 개발에 많은 투자를 해왔다. 호핀 개발 시에도, 개인화 추천 기능이 주요 차별화 포인트였다. 그런데 개발한 지 몇 년이 지난 지금의 모습은 사뭇 다르다. 우선 진입 페이지에서 볼 수 있는 접근 경로는, 개인화와는 거리가 먼, 장르/최신/인기/홍보 정도이다. 그나마 영화 페이지에서, ‘로맨스가 필요해!’ 같은 추천 카테고리가 나타나긴 하는데, 로그아웃해도 카테고리가 바뀌지 않는 것을 보면, ‘개인화’ 로직은 아닌 것 같다.

사실 개인화는 모든 컨텐트에 대한 접근성이 동등한 넷플릭스에 유리하다. 호핀의 경우는, 일단 무료 미끼 컨텐트가 있다. 또한, 최신 컨텐트에는 높은 요금 장벽이 있다. 그리고 여러 개의 할인 프로모션이 돌아간다. 당연히 컨텐트에 대한 접근성에 편향이 생길 것이다. 이 편향을 무시하고 굳이 개인화를 한다면, 나에게는 아마도 ‘싸구려 좋아하는 거지들을 위한 철 지난 구닥다리 컬렉션’이 추천될지도 모르겠다. 개인화가 답이고, 그것이 컨텐트에 대한 동등한 접근성을 전제로 해야 한다면, 호핀이 도전해야 할 가장 시급한 과제는 (넷플릭스 형의) 요금제 혁신(하기 어려우니까 ‘혁신’이다)이 아닐까?

그렇다면, 호핀보다는 월정액 요금제의 푹이 개인화의 가능성이 더 높다고 볼 수도 있겠다. 하지만 푹의 ‘추천’ 카테고리의 컨텐트들도 로그인/아웃에 영향을 받지 않는 것을 보면, ‘개인화’ 로직은 없는 것이다. 푹은 지상파 방송 컨텐트 라이브러리라는 태생적 한계가 있다. 미국과는 달리 한국 지상파 방송 소비는 아직도 프라임 타임 프로그램이 절대적이다. 절대다수의 소비는 ‘최신’과 ‘인기’ 프로그램에 몰린다. 그 몰리는 방송 3사의 컨텐트 풀이 별로 많지 않다는 것이 문제다. 아쉽게도 추천 로직이 별로 필요치 않다는 것이다. 사실 프로그램 리스트에서 자주 보는 프로그램을 높은 우선순위로 보여주는 정도의 기능만 있어도 만족할 것이다. (애석하게도, 현재 푹에는 그런 기능도 없는 것으로 판단된다.)

매번 넷플릭스가 정답인 양, 오늘도 결론은 이렇다. 결국, 개인화라는 것은, 그저 독립적인 기술 플랫폼만으로 존재할 수 있는 것이 아니고, 컨텐트 라이브러리와 요금제(컨텐트 접근성)가 전략적으로 삼위일체가 되어야 가능하다.

물론 넷플릭스도 진행형이다. 그것은 아주 긴 호흡이 필요하다.

 

[게몽]

Send to Kindle

20 thoughts on “영화를 구분하는 76,897 가지 방법

  1. 그래서 넷플릭스는 망하게 될까 | DIGXTAL

  2. hoppin사업팀장입니다. hoppin의 현주소와 앞으로 해야 할일에 대해 정확히 짚어 주셨네요. hoppin이 개인화를 위해서는 넷플릭스와 같은 영화 상품을 만들어 내는 것이 핵심입니다. 현재는 그런 상품을 못 만들고 있지요~ 구작 영화를 모아놓은 “영화야”나 최신 영화 40편 정도를 묶어놓은 “영화매니아” 상품이 있기는 하지만 가입자는 넷플릭스의 1/1000도 되지 않으니까요~ 어떻게 그런 상품을 만들 수 있을지 많이 고민하고 있는데, 쉽지 않네요

    • 한국 시장이 작은 게 문제겠죠? 음, 넷플릭스와 호핀이 합작해서 넷플릭스 코리아를 만드세요. 농담 반, 진담 반. ^^

  3. 넷플릭스 당하다(Netflixed) | DIGXTAL

의견 남겨주세요. 고맙습니다!