Size: a a a

2021 March 04

AZ

Anton Zadorozhniy in Data Engineers
В начале и середине десятых было так, от заказчиков с требованием «почините мою кассандру» не было отбоя
источник

N

Nikita Blagodarnyy in Data Engineers
В 2000х оракл дба получали какие-то заоблачные деньги. Особенно oracle certified.
источник

AZ

Anton Zadorozhniy in Data Engineers
А уже hbase как только не насиловали, одна шведско-индийская команда оставила по центральной и северной Европе большой след систем с высокой нормализацией, я прям удачно потрудился по их клиентам потом
источник

AZ

Anton Zadorozhniy in Data Engineers
Ещё помню раннюю монгу с ее проблемами везде пихали не зависимо от формы входного отверстия
источник

AZ

Anton Zadorozhniy in Data Engineers
Сейчас все грамотные, дело своё знают
источник

N

Nikita Blagodarnyy in Data Engineers
Anton Zadorozhniy
А уже hbase как только не насиловали, одна шведско-индийская команда оставила по центральной и северной Европе большой след систем с высокой нормализацией, я прям удачно потрудился по их клиентам потом
Денормализовывали?
источник

AZ

Anton Zadorozhniy in Data Engineers
Nikita Blagodarnyy
Денормализовывали?
Да там проще было переделать все, и написать приложение для миграции
источник

AZ

Anton Zadorozhniy in Data Engineers
Они разработчикам давали сырой клиент HBase и страницу с вики как правильно читать данные..
источник

AZ

Anton Zadorozhniy in Data Engineers
Никакого SDK, никаких метаданных в самой базе или рядом
источник

A

Alex in Data Engineers
Anton Zadorozhniy
Сейчас все грамотные, дело своё знают
Пихают везде реляционку и страдают меньше
источник

RK

Ravil Khalilov in Data Engineers
Иван Калининский
dba должны будут перейти на новый уровень и архитектить структуры. Появились девопсы, будут и архидэбэопсы ^^
Есть в нашей команде девопс ребята. Серьезные вопросы по БД они не решают,только поверхностные. По всем остальным вопросам касаемо реляционных и не реляционных БД мы помогаем коллегам из других команд
источник

RK

Ravil Khalilov in Data Engineers
Частично ДБА все же останется старым добрым ДБА
источник

VS

Vasily Surov in Data Engineers
Mikhail Epikhin
Привет!
А кто-то пользуется cdap.io или аналогами?
Как оно? Какие плюсы/минусы? Какие аналоги знаете?
Некоторое время имел с ним дело в виде Google Data Fusion. Модно, стильно, молодежно. Менеджеры были в восторге, квадратики можно  наговнякать за час и сразу в продакшине. Из минусов кластер очень дорогой, ну и постоянно что-то отваливалось или не работало, выделенный человек чуть ли не целыми днями все это богатство упихивал и палочкой в саппорт тыкал
источник

KS

K S in Data Engineers
No Name
Ну если хочется транзакций и роллбэков, то мб delta? Или не спарк?
Вот думаю может aws step functions как то пристроить.
источник

KS

K S in Data Engineers
Пока что получилось передать параметры из одной step function в glue job а оттуда во вторую step function. Непонятно как передать параметры в многоэтапной step function.

Например вот так работает:
StepFunc1 > GlueJob1 (param1=a)> StepFunc2.


А вот как вызвать из glue job другую glue job и потом результаты передать в оригинальную step function в определенный state.

Например так:
StepFunc1:State_A> GlueJob1 (param1=a)> GlueJob2 (path=results.parquet) > StepFunc1:State_B.
источник

KS

K S in Data Engineers
Почитал в инете, советуют записывать промежуточные результаты в S3 bucket или dynamo db, но что-то меня терзают смутные сомнения, что это всё лишнее.
источник

NN

No Name in Data Engineers
K S
Почитал в инете, советуют записывать промежуточные результаты в S3 bucket или dynamo db, но что-то меня терзают смутные сомнения, что это всё лишнее.
Я из деревни, у нас тут только hdfs есть, но вариант с промежуточными результатами в отдельной бд чёт даже мне кажется подозрительно неоптимальным.
источник

KS

K S in Data Engineers
No Name
Я из деревни, у нас тут только hdfs есть, но вариант с промежуточными результатами в отдельной бд чёт даже мне кажется подозрительно неоптимальным.
Да, эти городские с жиру бесятся. Как по мне, так я бы передавал напрямки в Step Function.
источник

N

Nikita Blagodarnyy in Data Engineers
Какие есть мнения по поводу своп разделов на SSD на ходуп-воркерах? Делать или нет?
источник

ME

Mikhail Epikhin in Data Engineers
Nikita Blagodarnyy
Какие есть мнения по поводу своп разделов на SSD на ходуп-воркерах? Делать или нет?
А что используете на hadoop воркерах? Просто если что-то джавовое, то вылезать jvm heap на swap всегда больно же
источник