Size: a a a

Data Science Chat

2021 September 24

ES

Elena Shamis in Data Science Chat
Привет! А пробовал кто-то глубокие сетки для классификации многомерных рядов? В первом же эксперименте с самой простой архитектурой 1д сверточной сети - чудовищное переобучение. 7 каналов ( по числу измеряемых сигналов). Ряды режу по 30 точек.  Данных получается - от 30к до 700к. А бустинги неплохо справляются. Но была надежда улучшить.
источник

В

Вадим in Data Science Chat
против переобучения есть тысяча и один прием. Надо втаскивать
источник

ES

Elena Shamis in Data Science Chat
Ну да, я их пробую, разумеется. Но поскольку переобучение очень сильное ( типа 85 accuracy на трейне и 65-70 на тесте) с первой эпохи, и дальше только хуже, я подозреваю, что есть принципиальные проблемы. До этого я с глубокими сетями работала только в вижн, с рядами только начала.
источник

В

Вадим in Data Science Chat
я бы не стал полагаться на accuracy
источник

AS

Aleksandr Sukhomlino... in Data Science Chat
у меня с lstm такая же ерунда, ставлю в скрытый слой один нейрон вообще, на трейне 0.08, на тесте 3.5 mse
так и не придумал как решить вопрос

думаю уволиться да пойти землю копать
источник

В

Вадим in Data Science Chat
Я сталкивался с таким. Выбираешь целевую метрику отличную от accuracy, ставишь lr очень очень маленький, и смотришь что можно получить
источник

В

Вадим in Data Science Chat
Если приближённо результат чуть лучше чем бейзлайн, тогда уже пробуешь регуляризовать
источник

ДС

Дмитрий Симаков... in Data Science Chat
Вопрос может быть не только с переобучением, а что сетка вообще не сходится.
источник

ДС

Дмитрий Симаков... in Data Science Chat
Ну и сетки на 30 точках учить, такое…
источник

В

Вадим in Data Science Chat
Так это жир:)
источник

AS

Aleksandr Sukhomlino... in Data Science Chat
ну у меня регрессия, везде mse ставил lr до 1e-5, попробую конечно еще понизить
источник

AS

Aleksandr Sukhomlino... in Data Science Chat
ну я надеялся что 4к сэмплов хватит..
источник

В

Вадим in Data Science Chat
Не, мало
источник

A

Andrey in Data Science Chat
1.use gru,
2. use lr 1e-4 with adam,
3. use smoothed series, kalman e.g.,
4. properly (standard) scale input and output features
5. use wide layers instead of deep
источник

AS

Aleksandr Sukhomlino... in Data Science Chat
с gru та же песня, только медленнее
источник

В

Вадим in Data Science Chat
Я бы даже не стал заморачиваться если 4к
источник

ДС

Дмитрий Симаков... in Data Science Chat
Вопрос не в семпле, а в уровне сигнала и какие паттерны вообще в сигнале есть.
источник

A

Andrey in Data Science Chat
30k же?
источник

В

Вадим in Data Science Chat
* тут
источник

A

Andrey in Data Science Chat
норм для gru, это 10 лет
источник