Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 July 22

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
я уже прочитал изначальный вопрос
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Minhyun Kim
Ренат начал чет про временные ряды заливать, я и подключился
так он вообще не в тему, там статы достаточно
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Для начала б изучить врменной ряд. стационарный не стационарый, дальше думать как предиктить. Какими моделями. Начал б с библиотеки prophet.
Станционный ряд
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
Iv
так он вообще не в тему, там статы достаточно
вот я и понял это))
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
Iv
по идее последовательные методы анализа, метод Вальда зайдет
Хорошо посмотрю спасибо
источник

К

Кir in Data Science Kazakhstan (DS/ML kz)
источник

TN

Timur Nurmagambetov in Data Science Kazakhstan (DS/ML kz)
кагл сертификаты к курсам дают за прослушивание или там реально нужно доказать знание?
источник

R

Roman in Data Science Kazakhstan (DS/ML kz)
Iv
так он вообще не в тему, там статы достаточно
Там же и о предсказаниях речь идёт, разве нет? «И плюс предиктинг»
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
Да предиктинг тоже нужен
источник

TN

Timur Nurmagambetov in Data Science Kazakhstan (DS/ML kz)
выбираете модель - константа матожидание, линейная интерполяция, квадратичная или еще какая нравится
или вы все хотите нейросетям поручить, не думаете что они не всегда лучший инструмент?)
тогда нужно сделать нейросеть которая будет говорить как решить эту проблему
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
Нет не нейросеть
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
Линейная
источник

VK

Vladimir Kolesnikov in Data Science Kazakhstan (DS/ML kz)
Не совсем понимаю в чем именно возникла сложность, отклонение от нормы это наверное больше задача метрологии, у оборудования в спецификации прописаны значения, которые можно считать допустимыми, ищите когда есть отклонения, и сравните когда они возникают, возможно в этом есть какая-то система. Можно решить конечно поиском аномалий, но без знания допустимых значимых, то, что мы посчитали аномалией, может оказаться нормой. С точки зрения предсказания у вас целый букет всяких подходов, начиная от эконометрических, заканчивая продвинутыми, по типу lstm, все зависит от вашего желания заморочиться и от требований к качеству прогноза. Можете наложить линейку, можете послушать курс от МФТИ и Яндекса про предсказывание временных рядов, на мой взгляд самый исчерпывающий курс, начиная от подбора параметров sarima, заканчивая сведением задачи к регрессии. Можете попробовать прикрутить lstm, аппроксимировать с помощью rnn, но убедитесь, что набор данных достаточен. В первую очередь проанализируйте структуру вашего временного ряда на момент стационарности, здесь супер наглядно показаны типовые нестационарности https://habr.com/ru/company/ods/blog/327242/, если ряд нестационарен, то пробуйте его сделать стационарным, если получается - арима ваш лучший друг, если нет - то, как описали выше, пробуйте нелинейные модели.
источник

ZO

Zhanar Omirbekova in Data Science Kazakhstan (DS/ML kz)
Vladimir Kolesnikov
Не совсем понимаю в чем именно возникла сложность, отклонение от нормы это наверное больше задача метрологии, у оборудования в спецификации прописаны значения, которые можно считать допустимыми, ищите когда есть отклонения, и сравните когда они возникают, возможно в этом есть какая-то система. Можно решить конечно поиском аномалий, но без знания допустимых значимых, то, что мы посчитали аномалией, может оказаться нормой. С точки зрения предсказания у вас целый букет всяких подходов, начиная от эконометрических, заканчивая продвинутыми, по типу lstm, все зависит от вашего желания заморочиться и от требований к качеству прогноза. Можете наложить линейку, можете послушать курс от МФТИ и Яндекса про предсказывание временных рядов, на мой взгляд самый исчерпывающий курс, начиная от подбора параметров sarima, заканчивая сведением задачи к регрессии. Можете попробовать прикрутить lstm, аппроксимировать с помощью rnn, но убедитесь, что набор данных достаточен. В первую очередь проанализируйте структуру вашего временного ряда на момент стационарности, здесь супер наглядно показаны типовые нестационарности https://habr.com/ru/company/ods/blog/327242/, если ряд нестационарен, то пробуйте его сделать стационарным, если получается - арима ваш лучший друг, если нет - то, как описали выше, пробуйте нелинейные модели.
Totally  agree,  а еще специфика процесса важна (технологический процесс) расход топлива чего, если это какое-то горение,  важные такие факторы,  как давление,  кинетика процесса и.т.д,  конечно можно найти регрессию, экстраполяцию, но надо понимать, что  в технологиях такие задачи решаются вместе :технологом + математик
источник

R

Roman in Data Science Kazakhstan (DS/ML kz)
чего вы к человеку прикопались)легко не легко
источник

ZO

Zhanar Omirbekova in Data Science Kazakhstan (DS/ML kz)
Roman
чего вы к человеку прикопались)легко не легко
источник

VK

Vladimir Kolesnikov in Data Science Kazakhstan (DS/ML kz)
Мотивируем человека погрузиться в специфику процесса. Если научиться понимать процесс, то многие странности в данных, которые кажутся аномальными, начнут казаться логичными и понятными, и тем самым можно сэкономить кучу времени, не тестируя ложные гипотезы
источник

ZO

Zhanar Omirbekova in Data Science Kazakhstan (DS/ML kz)
Vladimir Kolesnikov
Мотивируем человека погрузиться в специфику процесса. Если научиться понимать процесс, то многие странности в данных, которые кажутся аномальными, начнут казаться логичными и понятными, и тем самым можно сэкономить кучу времени, не тестируя ложные гипотезы
+++
источник

A

Aykhan in Data Science Kazakhstan (DS/ML kz)
Roman
чего вы к человеку прикопались)легко не легко
+
источник

A

Ads in Data Science Kazakhstan (DS/ML kz)
👌
источник