Телеграмм чат группы datasciencecourse страница 4746

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Machine learning

7690 membersпожаловаться на группу

2021 February 01

И

Илья in Machine learning

Ребят, привет, встала такая проблема, мб кто-то подскажет
как при помощи технологии speech recognition проверить, какое слово сказал на самом деле человек? Просто все эти нейронки «доводят» до правильного варианта самостоятельно и это не подходит, мб кто-то знает?
вообще, исходная проблема это сверить два варианта произношения между собой, один из который «эталонный», а другой от пользователя, если кто-то даст хотя бы совет, буду благодарен

источник

20:04пожаловаться #1

KA

K Azef in Machine learning

Здравствуйте! C6W4 Идентификация пользователей.
Не подскажете в чем может быть проблема. Не могу скормить ЛогРегу разреженную матрицу.

%%time
logit_cv_150users = LogisticRegressionCV(C_best, cv = skf, multi_class='ovr', n_jobs=-1, random_state=17)
logit_cv_150users.fit(X_train_150, y_train_150)

type(X_train_150) - scipy.sparse.csr.csr_matrix
type(y_train_150) - numpy.ndarray
X_train_150.shape - (95913, 27797)
y_train_150.shape - (95913, 1)
----------------------------------------------------------
TypeError: object of type 'float' has no len()

источник

22:02пожаловаться #2

K

K-S in Machine learning

февральский playground https://www.kaggle.com/c/tabular-playground-series-feb-2021/leaderboard

Tabular Playground Series - Feb 2021

Practice your ML skills on this approachable dataset!

источник

22:29пожаловаться #3

K

K-S in Machine learning

и снова регрессия

источник

22:30пожаловаться #4

IK

Ivan Krokhalyov in Machine learning

теперь регулярно такое будет?

источник

22:30пожаловаться #5

K

K-S in Machine learning

обещают каждый месяц

источник

22:30пожаловаться #6

K

K-S in Machine learning

а, они данные CTGAN'ом генерируют😂

источник

22:32пожаловаться #7

SS

Sergey Salnikov in Machine learning

теперь с категориями

источник

22:33пожаловаться #8

K

K-S in Machine learning

The dataset is used for this competition is synthetic, but based on a real dataset and generated using a CTGAN. The original dataset deals with predicting the amount of an insurance claim. Although the features are anonymized, they have properties relating to real-world features.

источник

22:33пожаловаться #9

K

K-S in Machine learning

Sergey Salnikov

теперь с категориями

хм... если они ординальные, а не просто от балды A,B,C назвали, то есть у меня кое что побенчмаркать

источник

22:35пожаловаться #10

AO

Alex Ololo in Machine learning

всем пивет. такой вопрос. есть системы атрибуции рекламного трафика. такие как апсфлайер. и вот в связи с отменой idfa на оси 14. им теперь очень тяжело этот самый трафик определять.
на сайте у них сл-яя инф-ия:
С помощью решения AppsFlyer разработчики приложений имеют полный контроль над своими данными и сами решают, как именно партнеры собирают и используют данные. AppsFlyer использует сочетание детерминированного и вероятностного моделирования в случаях, когда IDFA недоступен.

как у них работает вот это сочетание детерминированное и вероятностное моделирование? есть у кого мысли. может кто о реализоввывал сам

источник

22:41пожаловаться #11

Ю

Юрий in Machine learning

февральский playground https://www.kaggle.com/c/tabular-playground-series-feb-2021/leaderboard

Tabular Playground Series - Feb 2021

Practice your ML skills on this approachable dataset!

Как по Вашему, не является ли этот эксперимент с табличками признаком того, что на kaggle появился дефицит соревнований вследствие того, что он, как говорят злые языки, умирает? Опыта у Вас на kaggle поболе моего, нет таких ощущений? Или тут скорее дефицит именно табличек?

источник

22:46пожаловаться #12

SS

Sergey Salnikov in Machine learning

а мне нра, вот про DAE узнал, победитель неплохой нотебук про свое решение сделал

источник

22:55пожаловаться #13

Ю

Юрий in Machine learning

Sergey Salnikov

а мне нра, вот про DAE узнал, победитель неплохой нотебук про свое решение сделал

Я не говорю, что мне не нравится, скорее наоборот. Просто думаю с чем связан такой эксперимент у Каггла.

источник

22:59пожаловаться #14

SS

Sergey Salnikov in Machine learning

скорее - дефицит табличных, чтобы удержать народ

источник

23:00пожаловаться #15

SS

Sergey Salnikov in Machine learning

подтверждается тем, что в топ-20 только 3 novice

источник

23:02пожаловаться #16

SS

Sergey Salnikov in Machine learning

народ соскучился по старым добрым табличкам

источник

23:02пожаловаться #17

K

K-S in Machine learning

Как по Вашему, не является ли этот эксперимент с табличками признаком того, что на kaggle появился дефицит соревнований вследствие того, что он, как говорят злые языки, умирает? Опыта у Вас на kaggle поболе моего, нет таких ощущений? Или тут скорее дефицит именно табличек?

а черт его знает. В ОДС под новый год вроде бы Денис Воротынцев делал отчет по кагглу и другим соревнованиям за 2020-й год. Надо бы глянуть. Но вроде бы некая тенденция постепенного снижения популярности каггла действительно прослеживается. Очень сильно просели те же призовые, например. А сами соревнования что по заданиям, что по уровню конкуренции стали на порядок сложнее, чем 3-4 года назад. Сделать сейчас грандмастера и 3-4 года назад (а если дальше идти по времени, так и тем более) - вообще разные вещи. Раньше за обычные таблички призовые были на уровне 100k$. Года 3 назад уже они стали 50-60, а сейчас за гораздо более сложные вещи платят 20-25 в среднем. Вон майкрософт за свою задачку вообще всего десятку отсыпал. Если б не фейсбук со своим дипфейком на 1млн$, то вообще бы грусть была)

источник

23:07пожаловаться #18

K

K-S in Machine learning

Sergey Salnikov

народ соскучился по старым добрым табличкам

ну вот в том-то и дело. Видимо, среди компаний, которые раньше их устраивали (а это были в основном всякие бизнесовые компании), интереса к кагглу особого нет. Вот и приходится самим генерировать данные и платить кружками :c

источник

23:09пожаловаться #19

Ю

Юрий in Machine learning

а черт его знает. В ОДС под новый год вроде бы Денис Воротынцев делал отчет по кагглу и другим соревнованиям за 2020-й год. Надо бы глянуть. Но вроде бы некая тенденция постепенного снижения популярности каггла действительно прослеживается. Очень сильно просели те же призовые, например. А сами соревнования что по заданиям, что по уровню конкуренции стали на порядок сложнее, чем 3-4 года назад. Сделать сейчас грандмастера и 3-4 года назад (а если дальше идти по времени, так и тем более) - вообще разные вещи. Раньше за обычные таблички призовые были на уровне 100k$. Года 3 назад уже они стали 50-60, а сейчас за гораздо более сложные вещи платят 20-25 в среднем. Вон майкрософт за свою задачку вообще всего десятку отсыпал. Если б не фейсбук со своим дипфейком на 1млн$, то вообще бы грусть была)

Значит ли, что GM на kaggle становится более ценным званием? Или скорее наоборот, всем на него больше плевать, раз теряется популярность)

источник

23:09пожаловаться #20