Size: a a a

Data Science Chat

2021 September 30

DA

Daniil Agniashvili in Data Science Chat
Так то и железу по сути всё равно что считать, можно сделать чтобы 1+1 было 5)
источник
2021 October 01

A

Andrey in Data Science Chat
что-то я задумался тут. вроде все понятно, но чёткой границы сходу не могу провести.

когда в задаче временных рядов можно заменить валидацию с time series на kfold?

чую, что иногда можно. понятно, что отложенный тест всегда дальше трэйн. тем не менее, если считать все сэмплы равнозначными и несвязанными, почему бы их не перемешивать? протечки нет.

вопрос, собственно, когда их можно считать не связанными
источник

A

Andrey in Data Science Chat
Когда у тебя нет временного ряда
источник

S

Sohibjon in Data Science Chat
Переслано от Sohibjon
Привет всем У  меня имеется такой датафрейм
источник

S

Sohibjon in Data Science Chat
Переслано от Sohibjon
я хочу визуализировать его с помошью plotly , но не получается правльно ставить , но при этом в excel все корректно отображается,  я хочу добиться такого графика в plotly спасибо заранее
источник

A

Andrey in Data Science Chat
ну это понятно. а что если нарезать ряд без пересечений
источник

SL

Sergey L in Data Science Chat
Речь скорее о том, что решать задачи из разряда "почесать за правым ухом через спину левой пяткой, правой ноги" никто не запрещает, но и так считать можно, да😁
источник

DA

Daniil Agniashvili in Data Science Chat
Ога))
источник

A

Admin in Data Science Chat
У меня есть вопрос, я недавно прошёл тему числовой последовательности и её пределов. Имеет ли она применение для использования при техническом анализе котировок? И второе если кто использовал может подсказать небольшой алгоритм действий по применению.
источник

RY

Ruslan515 Y in Data Science Chat
Добрый день. Кто подскажет учебник и задачник где формально разбирается дифференцирование матриц? нашел в сети такую статью, но хочется глубже понять тему. http://nabatchikov.com/blog/view/matrix_der
источник

MC

Makha Cloud in Data Science Chat
@icetfoer, здоров, помню давеча ты говорил , что дата-инженеры максимум 250 , 300 совсем редко получают?Помнишь ?
источник

В

Вадим in Data Science Chat
Привет. Если так говорил то это не правда. Ну то есть не совсем так
источник

В

Вадим in Data Science Chat
Но да
источник

MC

Makha Cloud in Data Science Chat
)))
источник

WD

Wilfred Desert in Data Science Chat
Эх, если бы все было так просто и сводилось к анализу числовых последовательностей и их пределов.

Правда в том, что математический анализ точно нужен, если речь о quantitative finance и уж точно нужно такие основы знать.

Само по себе знание числовых последовательностей вряд ли тут как-то даст какой-то алгоритм для анализа котировок
источник

A

Andrey in Data Science Chat
даст, если числовые последовательности протащить через теорвер до ММК и далее до случайных процессов и с.д.у.
источник

A

Andrey in Data Science Chat
тут либо что-то простое (что скажет "нет"), либо вопрос глубокий и надо копать.

склоняюсь ко второму. в принципе, ну и что что таймсериес, если не искать в нем тренды/сезонности. тогда это просто регрессия Rn -> Rm. да, да?)
источник

DG

Dmitry Gorbatenko in Data Science Chat
валидация же должна быть приближена к запуску в проде
в проде вы по одному периоду считаете, а на другом (который в будущем) предсказываем

вы же не сможете в проде считать метрику по части пользователей и предсказывать ее для остальных. Вернее  сделать то вы сможете, но толку от этого может быть мало. Потому что в этот момент ее уже посчиатать можно по всем, зачем предсказывать то? 🙈
источник

ES

Elena Shamis in Data Science Chat
Привет! Недавно писала о чудовищном оверфиттинге 1д сверточной сетки при классификации временных рядов. Может кому интересно: самый первый эксперимент по сглаживанию ряда скользящим окном (переход к средним, дисперсиям и квантилям по окну, вместо оригинальных величин) полностью вылечил ситуацию. И результат обогнал сходу бустинги, которые раньше ничем не обгонялись, на 5 процентов.
источник

A

Andrey in Data Science Chat
я про отбор моделей на трэйне, про шаффл данных.

откладывать отложенный тест разумно в конце. но при отборе гиперпараметров, можно (ли?) перемешать сэмплы?

а почему бы и нет, если они не пересекаются? почему будущее важнее прошлого? точно ли sample weights по возрастанию это корректно?...

надо смотреть в природу данных...
источник