본문 바로가기

코딩 꿀팁

유튜브 추천 알고리즘, 나보다 나를 더 잘 아는 유튜브?!

출처 : MBC 캡처

롤린, 무야호, 빅맥송, 삼각함수의 노래, 학교폭력 멈춰!

이중 최소 하나는 알고 계시죠? 여러분이 유튜브를 사용하신다면 꼭 한 번 쯤은 보셨을 텐데요. 바로 ‘유튜브 알고리즘’에 이끌려서 말이죠.

‘오늘도 알 수 없는 유튜브 알고리즘이 나를 이 영상으로 끌고왔다.’, ‘무서운 알고리즘’ 등의 댓글을 심심치 않게 볼 수 있습니다. 유튜브는 끊임없이 여러분에게 영상을 추천합니다. 내가 봤던 영상과 유사한 영상일 때도 있지만, 정말 뜬금없는 영상이 추천되기도 하죠. 관심이 있든 없든 ‘이것만 보고 자야지’, ‘찐막(진짜 마지막)’을 외치며 다음 영상을 보고 있는 나 자신을 발견하게 하는 유튜브의 영상 추천, 대체 어떤 원리일까요?

우선, ‘알고리즘’이 무엇인지 알고 넘어가도록 합시다. 알고리즘이란, 어떤 문제의 해결을 위해 입력된 자료를 토대로 원하는 출력을 유도해 내는 규칙의 집합입니다.

유튜브가 해결하고자하는 문제는 ‘어떻게 해야 사용자가 유튜브를 꾸준히 방문하고, 오랜 시간 체류할 수 있을까?’입니다. 그래서 여러분의 과거 시청 영상, 좋아요, 구독 등의 데이터를 분석해 여러분이 흥미를 가질 만한 방향의 동영상을 제공하죠. 여러분이 마음에 들 만한 영상을 계속해서 추천해 궁극적으로 여러분이 오래 머물게 하는 것을 목표로 합니다.

 

그렇다면 유튜브의 추천 알고리즘의 작동 원리는 무엇일까요? 사실 정확히 알 수는 없습니다. 유튜브는 추천 알고리즘을 외부에 공개하고 있지 않기 때문입니다. 하지만 유튜브를 포함한 넷플릭스, 왓챠 등의 추천 알고리즘은 학습 기반 데이터에 따라 크게 두 가지 방법으로 나눌 수 있습니다.

 

 

첫 번째는 ‘콘텐츠 기반 필터링’입니다. 사용자가 시청한 콘텐츠의 특징을 기준으로 사용자가 선호하는 영상을 파악해, 그에 맞는 콘텐츠를 제공하는 방식입니다. 예를 들면, 평소에 게임 관련 유튜브를 시청하는 사용자에게는 시청하지 않았던 게임 유튜브 영상을 추천해주는 것이죠.

 

두 번째는 ‘협업 필터링’ 방법입니다. 협업 필터링은 추천의 기준이 콘텐츠가 아닌 ‘사용자’에 있습니다. 같은 성향이나 특성을 가진 사람은 유사한 선택을 한다는 가정을 기반으로 추천이 진행됩니다. 사용자의 나이, 성별, 성향 등을 분석해 유사한 선호와 취향을 가질 것으로 추정되는 사용자들을 한데 묶어 그들에게 같은 콘텐츠를 추천하는 것입니다. 협업 필터링은 콘텐츠 기반 필터링보다 정확성이 높다는 장점이 있습니다. 하지만 기본적으로 많은 데이터가 있어야 하므로 데이터가 부족한 초기에는 사용하기 어렵습니다.

 


 

이러한 추천 알고리즘의 원리로 유튜브나 넷플릭스, 왓챠 등의 서비스는 여러분에게 다양한 영상을 제공하는 것입니다. 이외에도 추천 시스템 알고리즘은 여러 가지 상황에서 잘 활용되고 있는데요. 과거 매출 데이터를 기반해 앞으로의 매출이 어떻게 될 지를 예상할 수도 있고, 지금까지 고객 유입 추이를 통해 앞으로 얼마나 고객이 유입될 수 있을 지도 예측할 수 있답니다.

자세히 알고리즘의 구조를 살펴보지는 않았지만, 어떠한 원리로 알고리즘이 진행되는지 알아보며 인공지능, 딥러닝에 한 걸음 더 나아가 보았습니다. 다음에는 더 쉽게 인공지능에 대해 알아보는 시간을 가지도록 해요!

(아참, 이 글을 다 읽으신 분들에게만 알려드리는 건데요. 스파르타 코딩클럽에서 AI 추천 시스템으로 미래를 예측할 수 있는 강의를 론칭할 예정이에요. 평소 관심이 있으셨다면, 조금만 기다려주세요! 컴잉 쑨!!)

 

▼▼ 스파르타 코딩클럽이 궁금하시다면? ▼▼

 

스파르타코딩클럽

5주 완성! 코딩을 전혀 모르는 비개발자 대상의 웹개발 강의

spartacodingclub.kr