Size: a a a

2019 June 18

РА

Рамиль Ахмадеев in Data Engineers
но я ренжер не мигрировал ни разу
источник

РА

Рамиль Ахмадеев in Data Engineers
но не думаю что это вах как сложно
источник

CO

Chern Oleksander in Data Engineers
Всем привет,кто-то может подскажет как правильно лучше организовать процесс на AWS
через api  забираем данные (Lambda) кладем в AWS S3 и паралельно складываем полученный JSON в Postgres SQL (11.2) формируем view в нужную структуру для аналитиков добавляем справочную инфу с других таблиц, отдаем view аналитикам они работаю через ole db (python, excel, quicksight, googlesheet)
но вот есть подозрение, что этот механизм не совсем практичный. Что скажите, подскажите?
Заранее благодарен!
источник

EV

Eduard Vlasov in Data Engineers
Chern Oleksander
Всем привет,кто-то может подскажет как правильно лучше организовать процесс на AWS
через api  забираем данные (Lambda) кладем в AWS S3 и паралельно складываем полученный JSON в Postgres SQL (11.2) формируем view в нужную структуру для аналитиков добавляем справочную инфу с других таблиц, отдаем view аналитикам они работаю через ole db (python, excel, quicksight, googlesheet)
но вот есть подозрение, что этот механизм не совсем практичный. Что скажите, подскажите?
Заранее благодарен!
источник

EV

Eduard Vlasov in Data Engineers
А, туплю, у вас не кликстрим
источник

EV

Eduard Vlasov in Data Engineers
Тут могу singer.io порекомендовать для лямбды
источник

EV

Eduard Vlasov in Data Engineers
если данных условно до сотни гигабайт то норм
источник

神風 in Data Engineers
Всем привет. Может кто-нибудь прояснить как hdfs блок  физически размещается на диске, то есть на дисках, если их много, или все-таки на одном диске из выделенных n на датаноде под hdfs ?
источник

CO

Chern Oleksander in Data Engineers
Eduard Vlasov
если данных условно до сотни гигабайт то норм
Тут типо из основных вопросов, нужно ли json раскладывать в реляционке или тупо с jdon формировать отчёт для аналитиков?
источник

EV

Eduard Vlasov in Data Engineers
нужно, но делается в 1 строку
источник

EV

Eduard Vlasov in Data Engineers
singer.io target-postgres
источник

EV

Eduard Vlasov in Data Engineers
и свой tap
источник

S

Stanislav in Data Engineers
神風
Всем привет. Может кто-нибудь прояснить как hdfs блок  физически размещается на диске, то есть на дисках, если их много, или все-таки на одном диске из выделенных n на датаноде под hdfs ?
Запросто
источник

S

Stanislav in Data Engineers
Но блоки в пределах одного сервера не размещается
источник

S

Stanislav in Data Engineers
Репл
источник

神風 in Data Engineers
Stanislav
Но блоки в пределах одного сервера не размещается
Один блок, скажем 128 стандарт. Он же ляжет на одну ноду. Вот, скажем, на ноде 5 дисков. Он ляжет на один физический диск или размажется кусками на все 5?
источник

S

Stanislav in Data Engineers
На один диск
источник

S

Stanislav in Data Engineers
В этом бонус последовательно записи и чтения
источник

S

Stanislav in Data Engineers
Головка диска будет стоять,  меньше ио
источник

神風 in Data Engineers
Спасибо
источник