
NYT получил доступ к внутреннему документу «TikTok Algo 100», подготовленному инженерами сервиса для сотрудников нетехнических отделов, чтобы объяснить работу алгоритма.
Интерес к алгоритмам TikTok во многом связан с социальной повесткой. Обеспокоенность пользователей вызывает пугающая чуткость соцсети к их душевной жизни: например, один пользователь заявил, что TikTok смог распознать его сексуальную ориентацию раньше, чем он сам себе в этом признался. Экспертов беспокоит влияние алгоритмов TikTok на подростков: соцсеть может распознать его депрессивные наклонности и усилить их, в результате чего он может причинить себе вред. Сотрудник TikTok поделился документом с журналистами из-за схожих опасений.
Отчасти документ «TikTok Algo 100» подтверждает очевидную догадку, что главная задача TikTok — вызвать зависимость от сервиса. Цель алгоритма — увеличить две метрики: проведённое на платформе время (time spent) и показатель удерживания пользователя в приложении (retention).
При этом сама работа алгоритмов технологически довольно проста, согласно предоставленному документу:
▪️ Базовая оценка того или иного видео основывается, во-первых, на предсказании алгоритма, будет ли оно интересно пользователю, во-вторых — на фактическом поведении людей, посмотревших ролик. Анализируется, было ли воспроизведено видео, сколько времени его смотрели, оставляют ли пользователи лайки/комментарии.
▪️Приводятся и более специфические фильтры. Например, иногда, чтобы понять ролик, необходимо быть в контексте предыдущих видео автора — тогда алгоритм добавляет фильтр 'same_author_seen'. Если алгоритм видит, что пользователю становится скучно в TikTok, он может отменить применение некоторых фильтров, провоцирующих воспроизведение однотипного контента вроде 'same_tag_today'.
💬 Точность рекомендаций TikTok достигается благодаря огромному набору данных и очень вовлечённым пользователям. «Это не какая-то магия алгоритмов», — заключает профессор Калифорнийского университета в Сан-Диего.
Неоднозначна и политика соцсети в отношении частного контента. NYT стало известно, что модераторы в TikTok имеют доступ не только к видео, опубликованным в открытом доступе, но и к контенту, адресованному друзьям; а также к неопубликованному контенту, который только загружен на платформу. Отсутствие сквозного шифрования как в WhatsApp, Telegram или Signal делает любые данные более уязвимыми для утечек или покупки брокерами данных.