제목은 거창하게 달아놓았지만


유튜브 왕초보의 관찰기입니다



유튜브를 처음 접하는 사람이라도 유튜브의 바다에서 몇시간씩.. 심하면 하루 종일 헤어나오지 못하는 이유가 뭘까요


생각해낼수 있는 모든분야,모든지역,모든 시기의 영상이 다 있다고 할 정도의 '방대함' 도 있겠지만

어떤 영상을 재생하는 도중 옆에 뜨는  '관련동영상' 의 초적절함이 큰 영향을 준다고 생각합니다.



예를 들어 추억의 영화 하나를  검색해서 보다 보면 관련영상으로  구미에 맞는 유사한 영화들의 트레일러 영상이 적절하게 뜨는것을 볼수있습니다. 아주 고구마 줄기를 잡아당겨 캐내듯이 마구마구 클릭하며 유튜브 속으로빠져들게 됩니다.


그것뿐만이 아니고 아주 짧은 영상의 경우  그 영상이 나타내는 '주제' '내용적 문맥' 과 동일한 종류의 영상이 기막힐 정도로 잘 제시됩니다.  예를 들면 꼬마가 실수로 넘어지는 영상을 볼때, 관련영상은  영상의 주제, 지역, 원작을 불문하고 유사한 컨텍스트를 가진 애니, ucc, 영화, 드라마, 쇼 속의 넘어지는 실수영상을 꼭꼭 집어내서 제시합니다. 어떨때 보면 영화 DB 인 IMDB 의 플롯DB 처럼 모든영상에 대해 수작업으로  플롯카테고리 입력을 해놓은게 아닌가 싶을 정도로 놀라울 관련영상을 보여줄 때가 많습니다.




구글이 관련동영상을 제시하는 법칙에 대해서 절로 궁금증이 드는데요


구글 도움말을 보면 '일정한 요인에 따라 자동으로 선택된다' 라고 합니다.


검색의 신 구글이 운영하니 당연히 기계적 알고리즘에 따라 제시되는건 맞는거 같습니다.

그 알고리즘을 시각화 해 본다면 SNS 의 연결망과도 같이 그물형태가 될 것입니다.


관련영상을 표출하는 정보를 크게 두가지로 나누어 본다면  '최초출생정보' 랑 '시청에 의한 누적된 정보' 두가지일텐데요. 막 태어난 영상은 후자 즉 '시청에 의한 누적된 정보'가 없습니다. 


유튜브에 새로 올라온 영상은 어떻게 관련영상의 그물 속에서 적절한 자기 위치를 잡게 되는걸까 궁금증이 생깁니다. 











실제 영상을 올리고 관련동영상의 변화를 관찰해보기로 했습니다.





완전 신생아 상태의 영상입니다. 조회수는 9





관련 영상중에 그 이유가 이해되는 것은 총 4개 입니다.


수지 직캠  <-  제가 바로 전에 올린 영상입니다. 즉 게시자의 이전 업로드 영상이 표출되었네요

2개의 자동차 영상 <- 게시자가 평소 즐겨검색하고 재생한 주제,BMW 자동차에 관련된 영상이 표출

벤큐 24인치 모니터 <- 올린 영상의 제목에 들어있는 '24인치' 와 관련된 것 같습니다


그 아래 영상들은 어떤 관련성이 있는지 잘 모르겠습니다. 구글이 임의적으로 표출한 것일까요


흥미로운것은, 게시자가 입력한 '태그' 는  신생아 영상의 관련영상 표출에 이용되지 않았습니다. 태그정보에 티아라, 롤리폴리, 코파카바나 등을 입력해 놓았는데요. 저 영어로 된 무관한 영상들을 표출할지언정  게시자가 입력한 태그로 검색될만한 영상들은 일단 표출하지 않고 있습니다. 


영상과는 무관한 태그를 마구 입력해서  유명영상의 옆자리 관련영상에 무임승차로 등장하려는 게시자의 장난질에 휘둘리지 않기 위한 구글의 기본적인 알고리즘 같습니다.










두번째 영상


올린지 며칠 된 영상입니다. 조회수 300단위




관련영상은 수지의 영상이 대부분인데요


첫번째 중앙선 건널목 <- 역시 게시자인 저의 영상입니다. 게시자 관련성

하단의 코요태 파란 <- 게시자의 영상입니다


나머지는 수지 (suzy) 의 방송영상이 주류를 이룹니다 


추측컨데, 며칠이 지나면  게시자 관련성은 있지만  막상 해당 영상과는 관련성이 떨어지는 건널목, 코요태 영상은 저기서 사라질꺼같습니다.


실제로 충분히 조회수가 쌓이고 사용자들의 클릭으로 관련성 정보가 누적된 영상들을 재생해보면 엉뚱한 관련영상을 좀처럼 표출하지 않습니다.






최초출생정보 에 속하는 정보들을 다시 나열해 보면


1.영상의 제목,설명 게시자가 입력한 태그   

2.게시자가 올린 다른 영상

3.게시자의 즐겨본 영상히스토리 

4.게시자 채널을 구독중인 사람들의 즐겨본 히스토리

5.영상속 각 프레임마다의 색조, 영상속에 고정적으로 존재하는 특정한 형상, 로고(방송국 로고 등)


이정도가 떠오르네요. 상상하지 못할 구글의 영상 DB화 알고리즘이 있는지는 모르겠습니다.




쓰고 보니 완전 똥글입니다 일단 요기서 그만쓰겠습니다 ㅠㅠ



영상의 출생 후 '시청에 의해 누적된 정보' 부분을  추가로 올렸습니다. 





+ Recent posts