Size: a a a

2019 September 20

C

Cesare Borgia in Data Engineers
Grigory Pomadchin
А почему и зачем так се понятно
Так и есть, я просто из вежливости сказал, что это то что я и ищу. У спарка и касандры есть отличная документация в стиле как, но зачем я там так и не нашел.
источник

AK

Anton Kosarev in Data Engineers
Вадим
дата инженер != программист с зоопарк стеком
все мануалы, роадмапы пытаются сказать обратное
кто-то должен собрать трубы и следить, чтобы по ним текли данные, по личному опыту аналитики могут написать скрипт, но не готовы брать на себя ответственность за работоспособность системы, SRE какие-нить готовы брать ответственность, что у тебя диски крутятся, но не готовы брать ответственность за "логику трансформаций" над данными. Мне кажется дата инженер как раз посередине и находится. Тебе нужно писать код (скрипты) и следить, чтобы это не взрывалось. На моем опыте все попытки сделать "давайте аналитики будут двигать кубики на UI и у нас все будет класс" или "а давайте аналитики будут писать SQL и у нас все будет класс" проваливаются
источник

A

Artem in Data Engineers
Anton Kosarev
кто-то должен собрать трубы и следить, чтобы по ним текли данные, по личному опыту аналитики могут написать скрипт, но не готовы брать на себя ответственность за работоспособность системы, SRE какие-нить готовы брать ответственность, что у тебя диски крутятся, но не готовы брать ответственность за "логику трансформаций" над данными. Мне кажется дата инженер как раз посередине и находится. Тебе нужно писать код (скрипты) и следить, чтобы это не взрывалось. На моем опыте все попытки сделать "давайте аналитики будут двигать кубики на UI и у нас все будет класс" или "а давайте аналитики будут писать SQL и у нас все будет класс" проваливаются
Чем это от программиста отличается?
источник

В

Вадим in Data Engineers
Artem
Чем это от программиста отличается?
Ничем :)
источник

A

Artem in Data Engineers
Вадим
Ничем :)
rebranding?
источник

В

Вадим in Data Engineers
Да не. Это про другое просто
источник

AK

Anton Kosarev in Data Engineers
могу только с бекендом сравнить: если поверхностно, то бекенд пишет микросервисы или парится с монолитом какбизнес логику скормить тупой машине, а дата инженер пишет скрипты и хитрые sql, чтобы найти причину почему у аналитиков не сошелся дебит с кредитом в прошлом месяце
источник

В

Вадим in Data Engineers
Anton Kosarev
могу только с бекендом сравнить: если поверхностно, то бекенд пишет микросервисы или парится с монолитом какбизнес логику скормить тупой машине, а дата инженер пишет скрипты и хитрые sql, чтобы найти причину почему у аналитиков не сошелся дебит с кредитом в прошлом месяце
Ну вот это уже ближе к правде
источник

RI

Rustam Iksanov in Data Engineers
Инженеры! Что-то не работает spark.write.mode("overwrite") пробовал  из шела и зеппелина. Пишет, что выполнилось без ошибок, но в hbase данных нет
источник

A

Artem in Data Engineers
Anton Kosarev
могу только с бекендом сравнить: если поверхностно, то бекенд пишет микросервисы или парится с монолитом какбизнес логику скормить тупой машине, а дата инженер пишет скрипты и хитрые sql, чтобы найти причину почему у аналитиков не сошелся дебит с кредитом в прошлом месяце
А если у тебя приложение на spark/streaming которое данные собирает, обрабатывает, модели предиктит, пишет в базу для пользователей/севисов. Платформа целая. Ты программист или data engineer?
источник

RI

Rustam Iksanov in Data Engineers
А кто должен прод модели писать? Дата саентист или дата инженер?
источник

R

Renarde in Data Engineers
Rustam Iksanov
А кто должен прод модели писать? Дата саентист или дата инженер?
Тут надо разделить - Модель написал DS, а DE упаковывает ее в продакшен процесс
источник

RI

Rustam Iksanov in Data Engineers
Rustam Iksanov
Инженеры! Что-то не работает spark.write.mode("overwrite") пробовал  из шела и зеппелина. Пишет, что выполнилось без ошибок, но в hbase данных нет
Инженеры, могут быть проблемы в настройки транзакции? например, спарк коннектор не посылает commit
источник

AR

Andrey RRR in Data Engineers
а логи БД чо говорят
источник

AR

Andrey RRR in Data Engineers
до БД доходит?
источник

RI

Rustam Iksanov in Data Engineers
Andrey RRR
а логи БД чо говорят
логи феникса пока найти не могу. Проблема именно в существующих таблицах. Создал тестовую таблицу. и Сделал в ней overwrite все прошло.
источник

МК

Михаил Королев in Data Engineers
Pavel Kashchenko
Добрый день. Подскажите пожалуйста по поводу размещения дата нод ходупа на вириуальных машинах. Мне говорят что это плохо. Это правда?
Зависит от виртуальных машин. У нас хадуп на них и ок
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel Kashchenko
Добрый день. Подскажите пожалуйста по поводу размещения дата нод ходупа на вириуальных машинах. Мне говорят что это плохо. Это правда?
EMR, Dataproc, HDInsight успешно работают на виртуалках, вопрос в том что вам нужно; при равном бюджете и с нуля в своем датацентре бареметал даст больше производительности
источник

UD

Uncel Duk in Data Engineers
Там не совсем "виртуалки"
источник

AZ

Anton Zadorozhniy in Data Engineers
в смысле?
источник