
오늘도 알 수 없는 유튜브 알고리즘이 나를 이끌어 주었다.2020년 2월 26일 발표된 과학기술정보통신부의 2019 인터넷 이용 실태조사 결과 보고서에 따르면, 한국의 81.2%가 인터넷을 통해 동영상 서비스를 이용하고 있으며 73.7%는 매일 동영상 서비스를 이용하고 있는 것으로 나타났습니다. 동영상 사용량이 증가하면서 온라인 OTT 서비스의 경쟁은 점차 가열되고 있는데, 국내 동영상 플랫폼 사용량 1위인 유튜브와 ‘구독자 수의 꾸준한 증가’, ‘동영상 플랫폼 만족도 1위’라는 타이틀을 가진 넷플릭스(Netflix)가 주목받을 것입니다. 유튜브와 넷플릭스가 각광받는 이유는 뭘까요?
닐 모한(Neal Mohan) 유튜브 최고상품 담당자는 2019년 3월 뉴욕타임스와의 인터뷰에서 “유튜브 이용자 시청시간의 70%가 권장 알고리즘을 통한 결과이며, 알고리즘 도입으로 전체 비디오 시청시간이 20배 이상 증가하였습니다.”라고 밝혔습니다. 넷플릭스 또한 매출의 75%가 권장 시스템을 통해 발생한다고 자체 평가에서 밝혔습니다. 즉, 이 두 개의 동영상 플랫폼은 기본적으로 볼 만한 콘텐츠가 많고 개인에게 맞는 콘텐츠를 추천하는 기능까지 갖추고 있기 때문에 온라인 동영상 플랫폼 대항마가 속속 등장하는 현 시점에서 왕좌를 지키고 있다고 볼 수 있습니다.
YouTube의 설정을 「자동 재생」으로 해, 멍하니 YouTube의 선택에 맡긴 영상을 보고 있으면, 「오늘도 모르는 YouTube 알고리즘이 나를 이 영상에 이끌어 왔다」라고 하는 코멘트에 높은 공감을 얻고, 상위에 기록되고 있는 것을 간단하게 찾을 수 있습니다. 넷플릭스 구독자라면 신규 콘텐츠 등록 시기마다 ‘OO님의 취향에 맞는 영화등록 공지’라는 메일을 받은 경험이 있을 것입니다. 때로는 나보다 자신의 취향을 더 잘 간파하고 있다는 느낌을 주는 온라인 동영상 플랫폼의 권장 알고리즘 기술에 대해 알아보겠습니다.

(출처:Getty Images Bank) 추천 알고리즘이란?알고리즘은 어떤 문제를 해결하기 위한 절차 또는 규칙의 모음이라고 할 수 있습니다. 포털의 검색 결과를 사용자가 원하는 방향으로 제공하거나 저작권 침해 콘텐츠 또는 유해한 콘텐츠를 선별하는 등 다양한 방면에서 알고리즘이 활용되고 있습니다. 그 중 우리의 일상에서 가장 친숙한 것은 추천 알고리즘입니다. 권장 알고리즘은 방대한 데이터 중 일정한 규칙에 따라 사용자가 좋아할 만한 콘텐츠를 추천하고 사용자 만족도를 높입니다. 또한 기업에서는 사용자의 플랫폼 체류 시간 및 콘텐츠 운영의 효율성을 높이고 구독자 이탈을 방지하는 효과적인 전략이 되고 있습니다.추천 알고리즘의 두 필터링 기법 – 콘텐츠 기반 필터링, 협업 필터링 –
알고리즘이 추천하는 컨텐츠를 선택하는 방법은, 크게 「컨텐츠 기반의 필터링」과「협업 필터링」의 2 개로 나뉩니다.

▲ 컨텐츠 기반의 필터링과 협업 필터링(출처: Softwarecarpentry) 컨텐츠 기반의 필터링(content-based filtering) 컨텐츠 기반의 필터링은 컨텐츠 정보 기반의 다른 컨텐츠를 추천하는 방법입니다. 영화 콘텐츠의 경우라면 영화의 줄거리, 등장 배우나 장르 등을 데이터화하고 상품이라면 상품의 상세 정보를 분석하여 추천하는 방법입니다. 콘텐츠기반필터링의장점은콘텐츠자체를분석하는것이기때문에초기사용자들의행동데이터가적어도권장합니다.
하지만콘텐츠기반의필터링도한계점을가지고있습니다. 콘텐츠의 정보를 모두 포함하기가 어렵다는 점입니다. 예를 들어 케이팝 그룹 엑소 멤버 중 수호의 팬들은 멤버 수호만이 등장하는 추천 콘텐츠를 찾고 있지만 겹치는 콘텐츠 정보가 많아 원치 않는 그룹 전체 혹은 그룹 내 다른 멤버들의 활동 모습이 담긴 콘텐츠를 추천받기도 합니다. 이와 같이 알고리즘의 입장에서 이용자의 성향을 상세하게 파악하기 어렵다는 문제가 발생합니다.협업 필터링(collaborative filtering) 협업 필터링은 많은 사용자로부터 얻은 기호 정보를 통해 사용자의 관심사를 자동으로 예측할 수 있게 하는 방법입니다. 같은 행동을 한 사람을 하나의 프로파일링 그룹으로 묶어서 그룹 내 사람들이 공통으로 본 콘텐츠를 추천하는 방법입니다. 예를들면,쇼핑몰에서상품을구매하면그상품을구매한사람이구매한다른상품을추천상품으로보여주거나SNS에서친구가된사람의친구를자동추천하는개념입니다.
그러나 협업 필터링의 경우 (1) 기존 데이터가 없는 신규 사용자의 경우 권장이 어렵다는 점, (2) 사용자가 많을수록 권장에 계산 시간이 오래 걸린다는 점, (3) 다수의 사용자가 관심을 보이는 소수의 콘텐츠가 전체 권장 콘텐츠로 보이는 비율이 높아지고 소외되는 콘텐츠가 생기는 한계를 갖게 됩니다.추천 알고리즘 구성 – 유튜브와 넷플릭스(Netflix) –

유튜브와 넷플릭스의 오스메 알고리즘이 어떤 방법으로 관찰되고 있는지 보겠습니다.
Netflix는 협업 필터링과 콘텐츠 기반 필터링의 단점을 보완하여 통합된 앙상블 시스템(ensemble System)을 사용함과 동시에 진일보하는 등 추천 알고리즘에 주력하고 있습니다. 우선, Netflix 는 같은 영상을 본 사람이 비슷한 패턴의 행동을 나타내면, 같은 프로파일링 그룹으로 연결하는 협업 필터링을 사용합니다.
예를 들어, 같은 영화를 시청하는 두 사람이 영상을 일반 배속이 아닌 느린 배속 혹은 빠른 배속을 적용하는 행위를 보이거나 드라마를 같은 회까지 보고 종료하는 행위를 보인다면, 그들은 같은 시청 패턴을 가진 한 그룹으로 묶일 수 있습니다. 이렇게그룹을나누는몇가지항목에는콘텐츠장르,오프닝스킵여부,재시청비율,사용기기,데이터환경,평가여부,중간정지여부,시청요일과시간,재생중에정지,돌아가기,빠르게진행지점등넷플릭스는아주다양한기준으로세부적인그룹을만들어내는것으로알려져있습니다. 협업 필터링으로부터 또, 컨텐츠 기반의 필터링의 방식을 섞습니다.
이 지점에서 넷플릭스는 AI의 능력뿐만 아니라 대규모 인력을 활용해 보유한 콘텐츠를 태그화하는 작업을 하고 있습니다. 영상분위기를묘사하는형용사,지역적요소,시대적배경,스토리의출처,등장인물의특징등다양한태그들이존재합니다.즉 영상 자체를 단순한 ‘코미디 장르’가 아니라 ’90년대 블랙코미디’, ’90년대 블랙코미디’, ‘여주인공 블랙코미디’ 등 콘텐츠에 구체적인 속성을 부여하는 거죠.
이에 대해 유튜브는 어떻게 추천 알고리즘을 구성할까요? 유튜브는 알고리즘을 외부에 공개하지 않습니다. 하지만 유튜브는 매일 유튜브에서 추천하는 영상 수만 약 2억 건 이상이며, 이는 사람의 인지능력을 벗어난 범위에서 컴퓨터 알고리즘이 해결해 준다고 밝힌 바 있습니다. 한 가지 재미있는 점은 유튜브는 영상제작자에게 실질적인 수익이 돌아가는 구조이기 때문에 제작자들은 유튜브 추천 알고리즘이 영상의 길이, 태그, 설명 등 콘텐츠의 다양한 특징을 반영한다는 점을 파악하고 알고리즘의 취향에 맞는 영상을 제작하기 위해 노력하고 있다는 점입니다.

출처 : AIGA Eyeon Design, 일러스트레이터 : Avalonhu, 완벽하진 않지만 제가 원하는 취향에 맞는 영상을 골라줄 추천 알고리즘에 대해 알아봤습니다. 이러한 추천 알고리즘이 더욱 발전하게 되면 누군가 우리의 마음 속을 보고 영상을 선택하게 될 것이라는 착각을 불러일으킬 정도의 추천 알고리즘이 바로 나타날 수도 있을 것입니다.
