Телеграмм чат группы datasciencechat страница 7085

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Science Chat

5162 membersпожаловаться на группу

2021 September 24

ES

Elena Shamis in Data Science Chat

Привет! А пробовал кто-то глубокие сетки для классификации многомерных рядов? В первом же эксперименте с самой простой архитектурой 1д сверточной сети - чудовищное переобучение. 7 каналов ( по числу измеряемых сигналов). Ряды режу по 30 точек. Данных получается - от 30к до 700к. А бустинги неплохо справляются. Но была надежда улучшить.

источник

14:06пожаловаться #1

В

Вадим in Data Science Chat

против переобучения есть тысяча и один прием. Надо втаскивать

источник

15:01пожаловаться #2

ES

Elena Shamis in Data Science Chat

Ну да, я их пробую, разумеется. Но поскольку переобучение очень сильное ( типа 85 accuracy на трейне и 65-70 на тесте) с первой эпохи, и дальше только хуже, я подозреваю, что есть принципиальные проблемы. До этого я с глубокими сетями работала только в вижн, с рядами только начала.

источник

15:13пожаловаться #3

В

Вадим in Data Science Chat

я бы не стал полагаться на accuracy

источник

15:15пожаловаться #4

AS

Aleksandr Sukhomlino... in Data Science Chat

у меня с lstm такая же ерунда, ставлю в скрытый слой один нейрон вообще, на трейне 0.08, на тесте 3.5 mse
так и не придумал как решить вопрос

думаю уволиться да пойти землю копать

источник

15:29пожаловаться #5

В

Вадим in Data Science Chat

Я сталкивался с таким. Выбираешь целевую метрику отличную от accuracy, ставишь lr очень очень маленький, и смотришь что можно получить

источник

15:32пожаловаться #6

В

Вадим in Data Science Chat

Если приближённо результат чуть лучше чем бейзлайн, тогда уже пробуешь регуляризовать

источник

15:33пожаловаться #7

ДС

Дмитрий Симаков... in Data Science Chat

Вопрос может быть не только с переобучением, а что сетка вообще не сходится.

источник

15:34пожаловаться #8

ДС

Дмитрий Симаков... in Data Science Chat

Ну и сетки на 30 точках учить, такое…

источник

15:35пожаловаться #9

В

Вадим in Data Science Chat

Так это жир:)

источник

15:35пожаловаться #10

AS

Aleksandr Sukhomlino... in Data Science Chat

ну у меня регрессия, везде mse ставил lr до 1e-5, попробую конечно еще понизить

источник

15:36пожаловаться #11

AS

Aleksandr Sukhomlino... in Data Science Chat

ну я надеялся что 4к сэмплов хватит..

источник

15:37пожаловаться #12

В

Вадим in Data Science Chat

Не, мало

источник

15:37пожаловаться #13

A

Andrey in Data Science Chat

1.use gru,
2. use lr 1e-4 with adam,
3. use smoothed series, kalman e.g.,
4. properly (standard) scale input and output features
5. use wide layers instead of deep

источник

15:37пожаловаться #14

AS

Aleksandr Sukhomlino... in Data Science Chat

с gru та же песня, только медленнее

источник

15:37пожаловаться #15

В

Вадим in Data Science Chat

Я бы даже не стал заморачиваться если 4к

источник

15:37пожаловаться #16

ДС

Дмитрий Симаков... in Data Science Chat

Вопрос не в семпле, а в уровне сигнала и какие паттерны вообще в сигнале есть.

источник

15:37пожаловаться #17

A

Andrey in Data Science Chat

30k же?

источник

15:37пожаловаться #18

В

Вадим in Data Science Chat

* тут

источник

15:38пожаловаться #19

A

Andrey in Data Science Chat

норм для gru, это 10 лет

источник

15:38пожаловаться #20