Size: a a a

2021 October 27

AZ

Anton Zadorozhniy in Data Engineers
прислать Pull Request?
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну там же всё на плюсах без оверхэда на сериализацию
источник

ЕГ

Евгений Глотов... in Data Engineers
А нам в питоны подавай
источник

AZ

Anton Zadorozhniy in Data Engineers
DSL на питоне который транслируется в кликовый SQL?
источник

ЕГ

Евгений Глотов... in Data Engineers
Arrow что ли туда вкорячивать как-то
источник

ЕГ

Евгений Глотов... in Data Engineers
Нет
источник

ЕГ

Евгений Глотов... in Data Engineers
Бустец
источник

AZ

Anton Zadorozhniy in Data Engineers
воообще in-database training очень overrated (и это пишет человек который пилит это дело)
источник

AZ

Anton Zadorozhniy in Data Engineers
достаточно чтобы SQL хорошо работал для обработки данных, потом можно выкачать для обучения, и дальше надо чтобы в СУБД была возможность сделать скоринг
источник

AZ

Anton Zadorozhniy in Data Engineers
это и операционно удобнее (ресурсы для обучения нужны не все время), и в плане экосистемы проще, и реализовать проще
источник

AZ

Anton Zadorozhniy in Data Engineers
каждый ДС фреймворк не интегрируешь, а если внешне:
1) сделал все джоины и оконки в базе
2) запустил тачку хоть с терабайтом памяти для обучения
3) выгрузил туда данные и обучил модель
4) модель сохранил, тачку дропнул

дешево, быстро, гибко
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну вот я у клика не нашёл "сделать скоринг" пока что
источник

ЕГ

Евгений Глотов... in Data Engineers
У athena есть?
источник

DT

Dmitry Titov in Data Engineers
Запихнуть несколько колонок в модельку и получить циферку в отдельную колонку?
источник

ЕГ

Евгений Глотов... in Data Engineers
одну циферку часто маловато бывает)
источник

AZ

Anton Zadorozhniy in Data Engineers
нет, у нас есть)
источник

DT

Dmitry Titov in Data Engineers
Ну можно не одну тогда :)

Это точно можно сделать через executable dictionaries
источник

AZ

Anton Zadorozhniy in Data Engineers
обычно это табличная функция или оператор, на вход берет бинарь модели, таблицу/резалтсет и маппинг между резалтсетом и входами модели
на выход структура с ответами
источник

AZ

Anton Zadorozhniy in Data Engineers
такая map-only джоба, в любой базе можно сделать, на крайний случай через динамический SQL
источник

DT

Dmitry Titov in Data Engineers
ну катбуст модели прямо в кх можно грузить, для остального можно через executable словарь или теперь через executable таблицу
источник