Size: a a a

2021 February 08

ET

E T in Data Engineers
Tsh Tsh
Обычно катятся в обратном направлении
Надоел хардкор NLP и хочется software инжиниринга больше и меньше математики
источник

ET

E T in Data Engineers
Tsh Tsh
Обычно катятся в обратном направлении
По денежке соизмеримо в DE, как я понял
источник

AZ

Anton Zadorozhniy in Data Engineers
E T
Надоел хардкор NLP и хочется software инжиниринга больше и меньше математики
Правильной дорогой идёте, товарищ; люди кто понимает и в DS и в DE наперечет, и не засиживаются на рынке
источник

P

PallivalloO in Data Engineers
/
источник
2021 February 09

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Правильной дорогой идёте, товарищ; люди кто понимает и в DS и в DE наперечет, и не засиживаются на рынке
вы понимаете в DS?
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
вы понимаете в DS?
Я притворяюсь (тссс)
источник

K

KrivdaTheTriewe in Data Engineers
научите пожалуйста
источник

DZ

Dmitry Zuev in Data Engineers
KrivdaTheTriewe
научите пожалуйста
Логрег, lightboost go brrr
источник

K

KrivdaTheTriewe in Data Engineers
Dmitry Zuev
Логрег, lightboost go brrr
это я умею
источник

K

KrivdaTheTriewe in Data Engineers
источник

K

KrivdaTheTriewe in Data Engineers
над резюмеху поправить терь
источник

AS

Andrey Smirnov in Data Engineers
Dmitry Zuev
Логрег, lightboost go brrr
Pycarret, и для солидности Keras
источник

D

Dmitry in Data Engineers
товарищи, подскажите где почитать/подсмотреть как сейчас модно скоринги делать с точки зрения подготовки данных. DS часть особо не интересна, этим отдельная команда занимается, больше всего интересует как готовят данные для готовых моделей. что попросит бизнес проскорить заранее не известно, сейчас раз в сутки пересчитываются агрегации по всему, что есть в даталейке. сложность в том что агрегируются по разным измерениям, например по адресному ключу клиента. адресный ключ зависит от источника, где-то улица, где-то почтовый индекс. соответственно при импорте сложновато понять какие агрегации надо обновить, если были изменения всего в одном адресе клиента.
интересует как такие вещи взрослые скоринг продукты решают.
источник

НК

Николай Крупий... in Data Engineers
Dmitry
товарищи, подскажите где почитать/подсмотреть как сейчас модно скоринги делать с точки зрения подготовки данных. DS часть особо не интересна, этим отдельная команда занимается, больше всего интересует как готовят данные для готовых моделей. что попросит бизнес проскорить заранее не известно, сейчас раз в сутки пересчитываются агрегации по всему, что есть в даталейке. сложность в том что агрегируются по разным измерениям, например по адресному ключу клиента. адресный ключ зависит от источника, где-то улица, где-то почтовый индекс. соответственно при импорте сложновато понять какие агрегации надо обновить, если были изменения всего в одном адресе клиента.
интересует как такие вещи взрослые скоринг продукты решают.
здесь именно применительно к "скорингу" нужно?

просто, на взгляд, кажется задачей выделения инкремента для ETL, не привязанной к конкретной прикладной области... 🤔
источник

D

Dmitry in Data Engineers
потому и интересуюсь, как это у других сделано. у нас DS заказывают очень специфические ... это наверно features на их языке. типа кол-во платежей по адресному ключу за последних 3 месяца, 6 месяцев. остальному BI такие вещи не интересны, у них чуток в другом разрезе витрины готовятся
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry
потому и интересуюсь, как это у других сделано. у нас DS заказывают очень специфические ... это наверно features на их языке. типа кол-во платежей по адресному ключу за последних 3 месяца, 6 месяцев. остальному BI такие вещи не интересны, у них чуток в другом разрезе витрины готовятся
feature store для людей кто строит аналитику это витрина с дополнительными метаданными вокруг нее, в этом смысле это может быть зависимая или независимая витрина, все приемы по перестройке витрин работают
источник

N

Nikita Blagodarnyy in Data Engineers
Andrey Smirnov
Pycarret, и для солидности Keras
Какие-то слова новые везде. Я че-то пропустил, саентологи перестали говнякать в пандас, нампи, сайкитлерн, питорч? Стакать иксжибусты и насиловать ариму?
источник

AS

Andrey Smirnov in Data Engineers
Nikita Blagodarnyy
Какие-то слова новые везде. Я че-то пропустил, саентологи перестали говнякать в пандас, нампи, сайкитлерн, питорч? Стакать иксжибусты и насиловать ариму?
Таки да, все более высокоуровневые инструменты, automl, все дела.
источник

N

Nikita Blagodarnyy in Data Engineers
Они ж вроде платные все были, H20  точно.
источник

AZ

Anton Zadorozhniy in Data Engineers
Andrey Smirnov
Таки да, все более высокоуровневые инструменты, automl, все дела.
это на каких-то показательных выступлениях кмк
источник