Size: a a a

2021 January 27

e

er@essbase.ru in Data Engineers
ага.
источник

AZ

Anton Zadorozhniy in Data Engineers
Можно конечно, в зависимости от того на чем и какой Спарк у вас может потребоваться какое-то количество опс-нянек
источник

AZ

Anton Zadorozhniy in Data Engineers
На Databricks SQL Analytics нянек надо мало, на ванильном плохо настроенном кластере нянька нужна на каждого пользователя
источник

АЖ

Андрей Жуков... in Data Engineers
У спарка же одбц платный
источник

EV

Eduard Vlasov in Data Engineers
er@essbase.ru
Народ а какой сценарий использования SparkSQL + ODBC. Туда можно пускать пользователей  ? или это только для разработчиков ?
Мы готовим промежуточные модельки (таблицы в hive) через dbt и Spark Thrift Server (у нас EMR)
источник

EV

Eduard Vlasov in Data Engineers
потом сервим все это хозяйство с помощью Presto так как для BI он пошустрее
источник

e

er@essbase.ru in Data Engineers
Андрей Жуков
У спарка же одбц платный
источник

АЖ

Андрей Жуков... in Data Engineers
О,  прикольно
источник

ME

Max Efremov in Data Engineers
Прочитал как Microsoft Spark и офигел)
источник

LT

Lan Tal in Data Engineers
Nikita Blagodarnyy
только TODO вычищу
+
источник

NN

No Name in Data Engineers
Max Efremov
Прочитал как Microsoft Spark и офигел)
:D
источник

АЖ

Андрей Жуков... in Data Engineers
А, ну он тоже формально не для са/емр/хадупа
источник

GP

Grigory Pomadchin in Data Engineers
Ньюслеттер сегодня:

Спарк под 2.13 уже собирается, снепшот можно попробовать https://repository.apache.org/content/repositories/snapshots/org/apache/spark/spark-core_2.13/3.2.0-SNAPSHOT/

2.13 релиз пока лочится багом компилятора https://github.com/scala/bug/issues/12038
источник
2021 January 28

AS

Andrey Smirnov in Data Engineers
Max Efremov
Прочитал как Microsoft Spark и офигел)
С учетом того сколько ms вложил в датабрикс возможно все
источник

Ad

A dn in Data Engineers
Who can help me
источник

AB

Andrey Bel in Data Engineers
A dn
Who can help me
Whats problem?
источник

MB

Mikhail Butalin in Data Engineers
Всем привет!
источник

MB

Mikhail Butalin in Data Engineers
Подскажите, висящие запросы в ожидании timeout'a это особенность архитектуры импалы или косяки разрабов которые этот запрос отправляют?
источник

KS

K S in Data Engineers
Бояре, встала задача интеграции пайплайнов с оркестрацией и билдами. Первой вехой в моём роадмепе стоит освоение CircleCI. Подскажите что почитать, желательно в контексте DE. Компания оплачивает мне доступ в O'Reilly online и другие системы обучения.
источник

DZ

Dmitry Zuev in Data Engineers
Собсна что в чем проблема с CI ? Собираешь доставляешь
источник