вот есть задача бинарной классификации - стоит подумать, что ценнее Precision/Recall/ранжирование или еще что с точки зрения бизнес метрик. Так и разворачиваешь луковицу
А если я просто отмечу пики на разных звукззаписях, ФНЧ оставлю все меньше 1000Гц , окном нарежу аудио, а потом скормлю в сверточной сетке, она научится?)
А почему только подумать? Почему бы не при(о)думать функцию полезности/ выручки/прибыли/ сокращение костов, помоделировать на валидации, и посмотреть какая метрика лучше ложится на функцию, графически или там корреляцией, и будет не только теория, а квазипрактика, подтвержденная экспериментами
Я не умный и не датасаентист, но так и есть, все сгрубления искажают, самое лучшее точечные, с расшивкой цветом, размером, много инфы, сложно для восприятия, но чувствуешь на кончиках пальцев всё
Всем добрый вечер! Может быть сталкивались с такими задачами - есть многомерные данные по пользователям, и основная задача - найти связанные (похожие, но не очевидно) аккаунты. Данные без лэйблов. При этом данные по адресу, балансу, ip-адресам, подключенным услугам. Пытаюсь решать это через кластеры. Может быть кто-нибудь знает способы лучше или кейсы?
И ещё вопрос кто-нибудь пробовал нейронки обучать и тюнить на мобильной RTX 3080, можете поделиться результатами по производительности? Потому что если ориентироваться на игровые тесты, то она на уровне 3060ti, но вот результатов бенчмарков по ML я не нашёл.
А ID аккаунтов даны? Просто через расстояние (евклидовское, косинусное) не вариант? Или задача — определить относятся ли «разные строчки» к одному и тому же юзеру не имея ID?