Size: a a a

Machine learning

2021 February 01

И

Илья in Machine learning
Ребят, привет, встала такая проблема, мб кто-то подскажет
как при помощи технологии speech recognition проверить, какое слово сказал на самом деле человек? Просто все эти нейронки «доводят» до правильного варианта самостоятельно и это не подходит, мб кто-то знает?
вообще, исходная проблема это сверить два варианта произношения между собой, один из который «эталонный», а другой от пользователя, если кто-то даст хотя бы совет, буду благодарен
источник

KA

K Azef in Machine learning
Здравствуйте! C6W4 Идентификация пользователей.
Не подскажете в чем может быть проблема. Не могу скормить ЛогРегу разреженную матрицу.

%%time
logit_cv_150users = LogisticRegressionCV(C_best, cv = skf, multi_class='ovr', n_jobs=-1, random_state=17)
logit_cv_150users.fit(X_train_150, y_train_150)

type(X_train_150) - scipy.sparse.csr.csr_matrix
type(y_train_150) - numpy.ndarray
X_train_150.shape - (95913, 27797)
y_train_150.shape - (95913, 1)
----------------------------------------------------------
TypeError: object of type 'float' has no len()
источник

K

K-S in Machine learning
источник

K

K-S in Machine learning
и снова регрессия
источник

IK

Ivan Krokhalyov in Machine learning
теперь регулярно такое будет?
источник

K

K-S in Machine learning
обещают каждый месяц
источник

K

K-S in Machine learning
а, они данные CTGAN'ом генерируют😂
источник

SS

Sergey Salnikov in Machine learning
теперь с категориями
источник

K

K-S in Machine learning
The dataset is used for this competition is synthetic, but based on a real dataset and generated using a CTGAN. The original dataset deals with predicting the amount of an insurance claim. Although the features are anonymized, they have properties relating to real-world features.
источник

K

K-S in Machine learning
Sergey Salnikov
теперь с категориями
хм... если они ординальные, а не просто от балды A,B,C назвали, то есть у меня кое что побенчмаркать
источник

AO

Alex Ololo in Machine learning
всем пивет. такой вопрос. есть системы атрибуции рекламного трафика. такие как апсфлайер. и вот в связи с отменой idfa на оси 14. им теперь очень тяжело этот самый трафик определять.
на сайте у них сл-яя инф-ия:
С помощью решения AppsFlyer разработчики приложений имеют полный контроль над своими данными и сами решают, как именно партнеры собирают и используют данные. AppsFlyer использует сочетание детерминированного и вероятностного моделирования в случаях, когда IDFA недоступен.

как у них работает вот это сочетание детерминированное и вероятностное моделирование? есть у кого мысли. может кто о реализоввывал сам
источник

Ю

Юрий in Machine learning
Как по Вашему, не является ли этот эксперимент с табличками признаком того, что на kaggle появился дефицит соревнований вследствие того, что он, как говорят злые языки, умирает? Опыта у Вас на kaggle поболе моего, нет таких ощущений? Или тут скорее дефицит именно табличек?
источник

SS

Sergey Salnikov in Machine learning
а мне нра, вот про DAE узнал, победитель неплохой нотебук про свое решение сделал
источник

Ю

Юрий in Machine learning
Sergey Salnikov
а мне нра, вот про DAE узнал, победитель неплохой нотебук про свое решение сделал
Я не говорю, что мне не нравится, скорее наоборот. Просто думаю с чем связан такой эксперимент у Каггла.
источник

SS

Sergey Salnikov in Machine learning
скорее - дефицит табличных, чтобы удержать народ
источник

SS

Sergey Salnikov in Machine learning
подтверждается тем, что в топ-20 только 3 novice
источник

SS

Sergey Salnikov in Machine learning
народ соскучился по старым добрым табличкам
источник

K

K-S in Machine learning
Юрий
Как по Вашему, не является ли этот эксперимент с табличками признаком того, что на kaggle появился дефицит соревнований вследствие того, что он, как говорят злые языки, умирает? Опыта у Вас на kaggle поболе моего, нет таких ощущений? Или тут скорее дефицит именно табличек?
а черт его знает. В ОДС под новый год вроде бы Денис Воротынцев делал отчет по кагглу и другим соревнованиям за 2020-й год. Надо бы глянуть. Но вроде бы некая тенденция постепенного снижения популярности каггла действительно прослеживается. Очень сильно просели те же призовые, например. А сами соревнования что по заданиям, что по уровню конкуренции стали на порядок сложнее, чем 3-4 года назад. Сделать сейчас грандмастера и 3-4 года назад (а если дальше идти по времени, так и тем более) - вообще разные вещи. Раньше за обычные таблички призовые были на уровне 100k$. Года 3 назад уже они стали 50-60, а сейчас за гораздо более сложные вещи платят 20-25 в среднем. Вон майкрософт за свою задачку вообще всего десятку отсыпал. Если б не фейсбук со своим дипфейком на 1млн$, то вообще бы грусть была)
источник

K

K-S in Machine learning
Sergey Salnikov
народ соскучился по старым добрым табличкам
ну вот в том-то и дело. Видимо, среди компаний, которые раньше их устраивали (а это были в основном всякие бизнесовые компании), интереса к кагглу особого нет. Вот и приходится самим генерировать данные и платить кружками :c
источник

Ю

Юрий in Machine learning
K-S
а черт его знает. В ОДС под новый год вроде бы Денис Воротынцев делал отчет по кагглу и другим соревнованиям за 2020-й год. Надо бы глянуть. Но вроде бы некая тенденция постепенного снижения популярности каггла действительно прослеживается. Очень сильно просели те же призовые, например. А сами соревнования что по заданиям, что по уровню конкуренции стали на порядок сложнее, чем 3-4 года назад. Сделать сейчас грандмастера и 3-4 года назад (а если дальше идти по времени, так и тем более) - вообще разные вещи. Раньше за обычные таблички призовые были на уровне 100k$. Года 3 назад уже они стали 50-60, а сейчас за гораздо более сложные вещи платят 20-25 в среднем. Вон майкрософт за свою задачку вообще всего десятку отсыпал. Если б не фейсбук со своим дипфейком на 1млн$, то вообще бы грусть была)
Значит ли, что GM на kaggle становится более ценным званием? Или скорее наоборот, всем на него больше плевать, раз теряется популярность)
источник