실시간 얼굴 인식? 동영상 얼굴 인식!

[요약] 2011년 MWC 행사에서 소개된 두가지 실시간 얼굴 인식 솔루션, 뷰들(Viewdle)과 올라웍스(Olaworks)에 대해 알아봅니다.

이번 MWC 행사에서 실시간 얼굴 인식에 대한 솔루션들이 소개되었습니다. 하나는 실리콘 밸리 신생 회사인 Viewdle, 또 다른 하나는 한국 회사인 올라웍스(olaworks)입니다.
두 회사 모두 카메라폰을 통해 입력되는 이미지를 실시간으로 분석하여, 이미지 속 인물들의 identity를 추출해 내는 기술을 소개했습니다. 데모 동영상을 일단 확인해 보시죠.

우선, Viewdle.

그리고, 올라웍스.

그런데 사실 얼굴 인식이 실시간으로 된다는 것은 기술적으로는 꽤 흥미로우나, 실질적으로 소비자들에게 그리 쓸만한 기능은 아닙니다. 위 회사들이 보여주듯이 카메라를 들이대서 누군지 인식해 내는 상황이라는 게 얼마나 어색합니까. 그보다는, 그만큼 얼굴 인식을 하는 프로세싱 성능이 그만큼 발전했다는 것을 보여주는 데 더 의의가 있겠지요.

그럼 이런 얼굴 인식 기술이 정작 필요한 곳은 어디일까요?
얼굴 인식에 대한 대중적 관심은 2009년 애플에서 iPhoto에 기능을 넣으면서 본격화되지 않았나 싶습니다. 이후에 구글 Picasa에서도 비슷한 기능을 출시했었죠.

얼굴 인식의 필요성은 바로 이런 아카이브에 대한 메타데이터 구축에 더 있다고 보여집니다. 그러니까, 방대한 미디어에 대한 메타 검색의 한 방법론으로써, 얼굴 인식이 중요한 역할을 담당할 수 있겠죠.
특히 동영상 검색에서는 더 그렇습니다. 현재의 동영상 검색이야, 보통 제목이나 태그 정보 정도로 추출이 되는 정도지만, 실제 동영상이라는 컨텐트는 수많은 장면과 오브젝트들로 이루어진 거대한 다큐멘트 전체에 대해서는 거의 까막눈입니다.
검색의 황제인 구글은 이미 이를 간파하고, 다양한 형태의 동영상 검색을 위한 기반을 다지고 있는 것으로 보입니다.
일찌감치 말풍선 형태의 사용자 참여형 오브젝트 태깅 서비스인 옴니시오를 인수했고, 음성인식 기술을 통한 자동 캡션 서비스를 도입하기도 했습니다. 모두 유튜브 사용자들을 위한 서비스인 것 같지만, 결국 이런 데이터베이스는 동영상내 장면이나 오브젝트에 대한 검색, 또는 대화 내용을 통한 장면 검색등에 사용될 수 있는 자산이 되는 것이지요.
좀 더 나아가서는 유튜브내 동영상에 등장하는 유명인들에 대한 얼굴을 인식하는 기술을 개발한다는 소식이 들려오기도 했습니다. (지금은 어떻게 진행되고 있는지 잘 모르겠습니다만.)

얼굴 인식이 중요한 곳은 바로 이곳, 방대한 데이터를 함유하고 있는 미디어 아카이브에 있습니다. 도서의 텍스트 내용을 검색하듯이, 사진의 인물, 동영상의 인물 오브젝트들을 인식해 내면, 미디어 검색 서비스에 큰 도움이 될 것입니다. 이게 발전한다면, 다음 포스팅에서 소개해 드렸던 것처럼, 인물 뿐 아니라 장면이나 다른 오브젝트들도 인식해 내는 날이 오겠지요.

2009/11/04 비디오 내의 오브젝트 검출 기술

하지만, 동영상 내 얼굴을 인식해 내는 것도 그리 쉬운 일은 아닌가 봅니다. 개발자가 아니어서 잘 모르겠지만, 아마 인식해 낼 대상 인물의 범위도 문제지만, 그 많은 인물의 인식적 특징을 데이터베이스로 구축하는 것이 쉬워보이진 않습니다.
모든 일은 단계별로 해야지요. 처음부터 완벽한 것을 할 수가 있나요. 일단 TV나 영화 VOD 사업에서는 우선 적용해 볼 수 있을 것 같습니다. 이들 컨텐트는 이미 등장 인물에 대한 메타데이터가 있기 때문에, 연예인들에 대한 얼굴 데이터베이스만 확보를 한다면 컨텐트를 분석하는 대상을 한정적으로 가져갈 수 있을 것입니다. 그럼 실시간으로도 제법 적중율이 높은 인식 결과를 보여줄 수도 있을 것 같습니다.

[게몽]

+ ReadWriteWeb + 경향신문

Update: 2011.6.14.
이 글의 원문은 여기에 있습니다. 포스팅 시각은 원문과 맞췄습니다. 글 서두에 [요약]문을 추가했습니다.

의견 남겨주세요. 고맙습니다!