ТРАКТАТ О SPOTIFY
Немного попользовался спотифаем на волне всеобщего интереса. Стоит ли говорить, что я не ощутил космического эффекта? По сути спотик ничем не отличается от прочих стриминговых платформ – алгоритмы рекомендаций, которые подаются как эдакая killer feature сервиса, реально полезны только в том случае, если ты решил вкатиться в совершенно новый для тебя жанр и послушать эссеншиалзы, или для каких-то суперказуальных вещей вроде плейлистов в обувных магазинах.
Тем не менее, эта агрессивная подача привела к тому, что мне стало интересно, как, собственно, работают рекомендации. Я нашел статью, где они достаточно наглядно описаны:
https://medium.com/s/story/spotifys-discover-weekly-how-machine-learning-finds-your-new-music-19a41ab76efe. Вкратце перескажу содержание – особенность Спотифая в том, что сырьем для его алгоритмов служит имплицитный фидбэк слушателя, т.е. паттерны поведения людей на платформе, которые, как предполагается, должны содержать косвенные признаки их предпочтений в будущем (в противоположность эксплицитно выставляемым пользователем оценкам) . Спотифай использует три основных механизма:
1.
Коллаборативная фильтрация (базовый метод рекомендательных систем, при котором сравниваются векторы предпочтений, и новые песни в рекомендациях одного юзера подбираются из наиболее похожих векторов других юзеров; в случае Спотифая оценки (элементы вектора) выставляются, исходя из истории действий пользователя – кликал ли он на страницу артиста, сохранял ли трек в свой плейлист и так далее);
2.
Процессинг текста (алгоритм анализирует рецухи и новости в музыкальных медиа, вычленяя из них ключевые эпитеты, описывающие ту или иную музыку. по-моему, самый забавный момент, так как наконец становится понятно, кто есть целевая аудитория всей этой цифровой макулатуры – несчастный робот-парсер, которому приходится читать гамно дни напролет 😃);
3. Анализ аудио-характеристик прослушиваемого (тональности, темпа, громкости, структуры).
Из написанного напрашивается несколько выводов. Во-первых, очевидно, что алгоритмы хваленых рекомендаций Спотифая сделаны не для удобства юзера; их основная цель – фармить легко структурируемые и коммодифицируемые данные, которые потом можно продать рекламщикам. Во-вторых, я бы предположил, что эта модель вносит еще больший дисбаланс между условным мейнстримом музыки и «андерграундом»: про второй можно собрать куда меньше таких имплицитных данных и элементов сходства с «базовой», мейнстримной музыкой – соответственно, ПОТАЕННАЯ ГОДНОТА будет вытеснена из рекомендаций в большинстве случаев.
В-третьих, я размечтался на тему того, каким бы я хотел видеть свой пиздатый рокенрольный стриминговый сервис мечты. Там, конечно, все было бы устроено, как у умных людей на порносайтах: поиск по облаку тегов с комбинацией и развитыми инструментами настройки (футфетиш флют-рэп, копрофилия баблгам поп, русское домашнее хардбасс). Плюс, конечно, пользователи могли бы самостоятельно тегать музыку различными прилагательными, описывающими, например, настроение музыки или любые свободные ассоциации. Из них бы составлялись семантические кластеры - чтобы ты мог набрать в поиске, к примеру, НЕРЕАЛЬНЫЙ РАЗЪЕБ и найти что-то себе по душе.
Ну и конечно, в моем стриминговом сервисе на панели прослушивания обязательно были бы следующие кнопки – slowed + reverb, nightcore, chopped & screwed и т.д. Не понимаю, как люди обходятся без них в 2020 году 😡😡😡