YouTube раскрыл алгоритмы персонализации контента
Видеосервис YouTubeрассказалоб алгоритмах составления индивидуальных рекомендаций роликов дляпользователей.
Критерии оценки контента
При формировании персонализированной ленты программа ориентируется на 80млрд информационных объектов, так называемых «сигналов», к которым относятсястандартные критерии (нажатия, время просмотра, ссылки на контент, отметки«Нравится» и «Не нравится»), а также результаты опросов.
Опросы помогают определить «ценное время просмотра» — время, котороепользователи сами оценивают, как проведенное с пользой. «“Ценное времяпросмотра” мы определяем с помощью опросов, где пользователь ставит видеооценку по шкале от одного до пяти. Так мы можем понять, доволен ли зрительконтентом. Если пользователь ставит видео одну или две звезды, мы спрашиваем,что ему не понравилось, а если четыре или пять — что оказалось полезным. Приподсчете ценного времени просмотра учитываются только те ролики, которым выпоставили четыре или пять звезд», — говорится в блоге компании.
На основе полученных ответов машинного обучения предсказывает возможныеоценки. Чтобы проверить точность этих прогнозов, YouTube исключает из заданиядля обучения часть уже выставленных пользователями оценок. Это позволяетпроверить, насколько полученные с помощью системы данные соответствуют реальнымответам.
Значимость каждого сигнала зависит от пользователя. Если он делится всемипросмотренными видео, даже теми, которым поставил одну или две звезды, системане учтет отправленные ссылки на контент при подборе рекомендаций. «Нашиалгоритмы не базируются на четких правилах, а адаптируются к вашемуповедению», — подчеркивают в компании.
Информационный контент
Перечисленные алгоритмы больше подходят для музыки и развлекательногоконтента. В случае с новостями и информационными видео подключаютсядополнительные инструменты. В частности фактчекинг. Проверенный контент от«пограничного» платформа отделяет с помощью классификаторов. Качествоинформации оценивают специалисты со всего мира, обучающиеся по подробнымобщедоступным правилам видеосервиса. Также YouTube обращается ксертифицированным экспертам.
Чтобы определить авторитетность контента, специалисты по оценке отвечают нанесколько ключевых вопросов: «Материалы отвечают заявленной цели?», «Какойуровень квалификации требуется, чтобы понять смысл видео?», «Какая репутация увыступающего в ролике человека и канала, на котором оно опубликовано?», «Какаяосновная тематика видео?», «Контент задуман как сатирический?». Ответыопределяют, насколько видео заслуживает доверия. Чем выше оценка, тем активнееролик продвигается в рамках новостного и информационного контента.
Чтобы определить пограничные видео, специалисты по оценке отмечают фактприсутствия неточного, вводящего в заблуждение, оскорбительного,нетолерантного, реально или потенциально вредоносного контента и другие. Наосновании общих результатов определяется вероятность, что в ролик содержитвредоносную информацию или пограничный контент. Видео, которые классифицируютсякак пограничный контент удаляются из рекомендаций.
В прошлом году РКНобратилвнимание на то, что в «тренды» YouTube перестали попадать роликиYouTube-канала «Соловьев LIVE». В ведомстве посчитали, что это попытка«ограничить распространение материалов популярного автора, воспрепятствоватьросту его аудитории».