YouTube розповів, як працює його алгоритм рекомендацій

Рекомендації направляють глядачів і приносять більше половини загальної кількості переглядів на YouTube: більше, ніж підписки на канали або пошук. Однак найчастіше користувачі не уявляють, як насправді працюють рекомендації, тому Google розповів, як влаштовані і як удосконалюються рекомендації.

Що таке система рекомендацій

Система рекомендацій ґрунтується на простому принципі – вона повинна допомагати користувачам знаходити відео, які їм цікаві і корисні. Рекомендації відображаються в двох основних розділах: на головній сторінці та на панелі «Наступне». Головна сторінка – це перше, що користувач бачить на YouTube, на ній доступні персоналізовані рекомендації, підписки, а також свіжі новини та інформація. Панель «Наступне» з’являється під час перегляду відео і пропонує додатковий контент, сформований на основі інформації про те, що дивиться користувач в даний момент, а також на основі контенту, який може його зацікавити.

У 2008 році система працювала абсолютно інакше. Відео відбиралися виходячи з їхньої популярності і групувалися на одній сторінці. Мало хто дивився такі рекомендації, і більшу частину переглядів на YouTube приносив пошук і зовнішні посилання.

Сьогодні система класифікує мільярди відео, щоб підібрати контент, відповідний інтересам аудиторії. На відміну від інших платформ, YouTube НЕ підбирає для користувачів контент на підставі соціальної активності.

Система порівнює дії користувачів в сервісі зі схожою поведінкою і на підставі цієї інформації пропонує контент, який може їх зацікавити. При цьому для новинних та інформаційних розділів принцип роботи рекомендацій може відрізнятися.

Звичайно, не всі користувачі готові ділитися особистою інформацією. Тому розробники створили настройки конфіденційності, щоб вони самі могли вирішувати, доступ до яких даними хочуть надавати. Тут можна видаляти, редагувати і тимчасово відключати історію пошуку і переглядів на YouTube.

Як рекомендації персоналізуються

Для того, щоб запропонувати кожному користувачеві індивідуальні рекомендації, система не базується на жорсткому регламенті. Вона постійно розвивається і вчиться, аналізуючи 80 мільярдів інформаційних об’єктів. Щоб визначити переваги, алгоритми беруть до уваги безліч сигналів: натискання, час перегляду, результати опитувань, посилання на контент, а також позначки «Подобається» і «Не подобається».

  • Кліки. Коли користувач клацає на відео, це з великою ймовірністю говорить про те, що воно здасться йому цікавим.
  • Час перегляду. Аналізуючи, які відео глядачі дивилися і як довго, система отримує персоналізовані сигнали про те, який контент їм швидше за все сподобається.
  • Результати опитувань. Щоб напевно визначити, чи задоволені глядачі контентом, який вони дивляться, YouTube враховує так зване «цінний час перегляду». Це час, який самі користувачі оцінюють як проведений з користю. «Цінний час перегляду» визначається за допомогою опитувань, де користувач ставить відео оцінку за шкалою від одного до п’яти. При підрахунку цінного часу перегляду враховуються тільки ті ролики, яким поставили чотири або п’ять зірок. Звичайно, не всі користувачі проходять опитування після кожного переглянутого відео. На основі отриманих відповідей модель машинного навчання навчилася передбачати можливі оцінки.
  • Посилання на контент, а також позначки «Подобається» і «Не подобається». Зазвичай якщо користувач ділиться відео або ставить йому оцінку «Подобається», це означає, що він задоволений цим контентом. Система використовує цю інформацію, щоб передбачати ймовірність того, що він поділиться наступними роликами або поставите їм позначку «Подобається». Коли глядач натискає «Не подобається», це сигнал, що контент не відображено йому цікавим.

Фокус на якісні рекомендації

Аналіз натискань, переглядів, часу перегляду, опитування користувачів, посилання на контент, позначки «Подобається» і «Не подобається» – все це ефективно працює для підбору рекомендацій на найпопулярніші теми на YouTube такі, як музика і розваги. Але за останні роки спостерігається тенденція, що все більше користувачів приходять на YouTube за новинами та інформацією. Будь це актуальні новини або складні наукові дослідження, для таких тем дуже важлива якість контенту і контекст. Хтось може поставити високу оцінку відео, де стверджується, що Земля пласка, але це не означає, що соцмережа буде рекомендувати подібний неякісний контент.

Саме тому рекомендації відіграють важливу роль в процесі побудови платформи, яка вселяє довіру. YouTube пропонує глядачам перевірену інформацію і мінімізуємо ймовірність того, що вони зіткнуться з сумнівним змістом. При цьому враховуються правила спільноти, що визначають, які матеріали дозволені, а які заборонені.

В останні роки збільшилася кількість недостовірної інформації, тому розробники поліпшили систему рекомендацій, щоб вона могла обробляти відео з невірними даними, а також спірне контент (матеріали, які близькі до порушення правил спільноти, але технічно цього не роблять). Наприклад, ролики з конспірологічними теоріями ( «висадка людини на Місяць була сфальсифікована») та інші відео, які розповсюджують неправдиву інформацію ( «апельсиновий сік може вилікувати рак»).

Платформа відокремлює перевірений контент від прикордонного з допомогою класифікаторів. Оцінку якості інформації, представленої на каналі або в відео, здійснюють фахівці з усього світу, які навчаються за докладним загальнодоступним правилам. YouTube також звертається до сертифікованих експертів, наприклад, лікарям, коли контент містить інформацію, що стосується здоров’я.

Щоб визначити авторитетність контенту, фахівці з оцінки відповідають на кілька ключових питань. Матеріали відповідають заявленій меті? Який рівень кваліфікації потрібно, щоб зрозуміти сенс відео? Яка репутація у виступаючого в ролику людини і каналу, на якому він опублікований? Яка основна тематика відео (наприклад, «Новини», «Спорт», «Історія», «Наука» і т. Д.)? Контент задуманий як сатиричний? Відповіді на ці та інші питання визначають, наскільки відео заслуговує довіри. Чим вище оцінка, тим активніше ролик просувається в рамках новинного і інформаційного контенту. Щоб визначити прикордонні відео, фахівці з оцінки відзначають факт присутності неточного, що вводить в оману, образливого, нетолерантного, реально або потенційно шкідливого контенту і інші. На підставі загальних результатів визначається ймовірність, що в ролик містить шкідливу інформацію або прикордонний контент. Відео, які класифікуються як прикордонний контент видаляються з рекомендацій.

Джерело

Залишити відповідь