Size: a a a

2021 March 02

e

er@essbase.ru in Data Engineers
Anton Zadorozhniy
был такой проект, HPL/SQL, но я не знаю статус
Хороший проект)) он вошёл в дистрибутив , но ... внешние ограничения.
источник

e

er@essbase.ru in Data Engineers
Anton Zadorozhniy
как архитектор я бы переделывал на микросервисы конечно, in-database процедуры без базы данных это еще хуже чем обычные процедуры в базе
Мне не понятно))  микросервисы на хадупе ?
источник

AZ

Anton Zadorozhniy in Data Engineers
er@essbase.ru
Мне не понятно))  микросервисы на хадупе ?
микросервисы на чем угодно, там же у вас наверное динамический SQL по метаданным?
источник

AZ

Anton Zadorozhniy in Data Engineers
если курсоры то будет еще больнее
источник

e

er@essbase.ru in Data Engineers
Anton Zadorozhniy
микросервисы на чем угодно, там же у вас наверное динамический SQL по метаданным?
Ну да. Sql с параметрами . Без курсоров.
источник

AZ

Anton Zadorozhniy in Data Engineers
er@essbase.ru
Ну да. Sql с параметрами . Без курсоров.
ну вот, вы генерите и сабмитите SQL в хайв из вашего микросервиса, метаданные можно в какой-нибудь маленькой базе хранить
источник

D

Dmitriy in Data Engineers
Господа, что бы вы сказали на попытку отыскать SQL engine поверха k8s+ceph для вычислений с данными по 7-10mln записей в день?
источник

e

er@essbase.ru in Data Engineers
Т.е. промежуточные таблицы на каждый чих ?
источник

AZ

Anton Zadorozhniy in Data Engineers
er@essbase.ru
Т.е. промежуточные таблицы на каждый чих ?
это уже зависит от деталей, но в пределе - да, зато будет много данных (и какой-то чекпоинтинг для длительных процессов)
источник

AZ

Anton Zadorozhniy in Data Engineers
вообще надо начать этот разговор с пристального взгляда на архитектора который такое предложил, но тут уже не технические вопросы
источник

T

T in Data Engineers
Dmitriy
Господа, что бы вы сказали на попытку отыскать SQL engine поверха k8s+ceph для вычислений с данными по 7-10mln записей в день?
10 мл можно просто в базу положить
источник

T

T in Data Engineers
Dmitriy
Господа, что бы вы сказали на попытку отыскать SQL engine поверха k8s+ceph для вычислений с данными по 7-10mln записей в день?
Вы сначала размеры оцените свои. А так presto/trino должно подойти
источник

А

Алексей in Data Engineers
почему бы не использовать spark? - код на драйвере - это аналог pl/sql
источник

e

er@essbase.ru in Data Engineers
Anton Zadorozhniy
вообще надо начать этот разговор с пристального взгляда на архитектора который такое предложил, но тут уже не технические вопросы
*В ит меня одно радует, что из-за ошибок нет риска для жизни. 😁 Нервы не в счёт .
источник

T

T in Data Engineers
er@essbase.ru
*В ит меня одно радует, что из-за ошибок нет риска для жизни. 😁 Нервы не в счёт .
Ребята из Боинга тоже так думали
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitriy
Господа, что бы вы сказали на попытку отыскать SQL engine поверха k8s+ceph для вычислений с данными по 7-10mln записей в день?
Я бы сказал что вам нужно познакомиться с базами данных, они классные!
источник

T

T in Data Engineers
Anton Zadorozhniy
Я бы сказал что вам нужно познакомиться с базами данных, они классные!
+++
источник

AZ

Anton Zadorozhniy in Data Engineers
er@essbase.ru
*В ит меня одно радует, что из-за ошибок нет риска для жизни. 😁 Нервы не в счёт .
У вас какое-то особенное ИТ
источник

DZ

Dmitry Zuev in Data Engineers
er@essbase.ru
*В ит меня одно радует, что из-за ошибок нет риска для жизни. 😁 Нервы не в счёт .
Главное с Бабушкиным не работать
источник

N

Nikita Blagodarnyy in Data Engineers
Oleg Ilinsky
да вот немного должно быть
Дефолтные значения я не менял, но спарк почему-то в 300 секунд не укладывается и падает с таймаутом. Я ща пока убрал бродкаст джоин, посмотрим, что скажут)
А перестартовать трифт-сервер с уменьшенным доспустимым бродкастом? Чтобы он не выбирал его постоянно.
источник