Size: a a a

2021 May 07

AT

Al T in Data Engineers
EMR on EKS самый простой способ, Fargate тоже можно. контейнеры стартуют очень быстро если есть в группе уже машины, если нет - то время поднятия ec2 в ASG -1-2 минуты и дальше уже все шустро
источник

AZ

Anton Zadorozhniy in Data Engineers
главное - дешево, если комбинировать обычную нодгруппу и фаргейт профили то можно очень круто сэкономить, при том что время подъема только чуть-чуть увеличивается
источник

AZ

Anton Zadorozhniy in Data Engineers
у меня так AnalyticOps работает - постоянные сервисы бегут на 1-2 узлах в нодгруппе, а все джобы обучения, оценки и скоринга моделей - в фаргейт профилях
источник

AT

Al T in Data Engineers
Согласен с вами коллега
источник

AT

Al T in Data Engineers
В принципе с eks autscaler его тоже можно в ноль настроить чтоб все выключал
источник

AZ

Anton Zadorozhniy in Data Engineers
получается не так дешево, из-за того что у нас пользователь может указать число ресурсов - получается фрагментация
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Чуть больше, я про это года 2-3 назад узнал
источник

V_

Vadzim _B in Data Engineers
Добрый день, может вопрос не по теме, но кто-нибудь размещал модельку на Google cloud ai plattform? Можете пожалуйста откликнуться, есть пару вопросов
источник

ПФ

Паша Финкельштейн... in Data Engineers
Переслано от Mikhail Kumachev
Коллеги,

Если вы уже устали отдыхать в нерабочие дни, то мы собрали для вас второй дайджест интересных материалов:

https://digest.deordie.org/May_the_Force_be_with_you/

Напомню, что у нас есть issue tracker: https://github.com/deordie/deordie-digest/issues
Приносите туда те материалы, которые оказались интересными/полезными для вас, а также голосуйте за понравившиеся материалы от коллег (+1).
источник

S

Sebastian in Data Engineers
Как грамотно написать скл адаптеры на питоне?
источник

AZ

Anton Zadorozhniy in Data Engineers
Как задать понятный вопрос?
источник

S

Sebastian in Data Engineers
https://github.com/aeonicentity/SQLAdapter/blob/master/MySqlAdapter.py

типа такого, чтобы оперировать базой быстрее и не было горы кода в одном файле
источник

AZ

Anton Zadorozhniy in Data Engineers
в смысле ORM?)
источник

AZ

Anton Zadorozhniy in Data Engineers
SQLAlchemy чем-то не подошел?
источник

S

Sebastian in Data Engineers
пока не пробовал алхимию. походу, орм хочу сделать?
источник

AZ

Anton Zadorozhniy in Data Engineers
я не очень понимаю что вы хотите сделать, полноценный ОРМ или какой-то промежуточный вариант без валидации или каких-то еще фич, если вы задачку получше поясните - можно ответ получше получить
источник

S

Sebastian in Data Engineers
я сейчас занимаюсь миграцией базы данных из оракла в майскл, они большие - для этого
источник

S

Sebastian in Data Engineers
в процессе из кода получается длинная партянка, и на неё неприятно становится смотреть. разделил запросы по разным классам, стало легче на душе)
источник

AZ

Anton Zadorozhniy in Data Engineers
например teradataml это тоже SQL адаптер на питоне, это намного проще написать, чем расписывать гистограмму через SQL или тащить данные на клиента hist = valib.Histogram(data=df, columns=','.join(continuous_vars))
источник

AZ

Anton Zadorozhniy in Data Engineers
тут мне трудно что-то посоветовать
источник