Size: a a a

2021 July 08

ПФ

Паша Финкельштейн... in Data Engineers
Ну револют и тиньков разрабатывают на котлине заметной частью
источник

ПФ

Паша Финкельштейн... in Data Engineers
приходи в личку, спрашивай, что-то я могу сказать
источник

ПФ

Паша Финкельштейн... in Data Engineers
Тут говорят что Спарк намного быстрее на граале
источник

ПФ

Паша Финкельштейн... in Data Engineers
Переслано от Oleg Shelajev
смотрите кто-угодно может прославиться на весь мир просто используя граальвм -- вот тут про какую-то социальную сеть статья https://medium.com/graalvm/graalvm-at-facebook-af09338ac519
источник

e

er@essbase.ru in Data Engineers
источник

e

er@essbase.ru in Data Engineers
Ну т.е. это Oracle ?)
источник

ПФ

Паша Финкельштейн... in Data Engineers
Можно и себе купить, но у оракла конечно
источник
2021 July 09

NN

No Name in Data Engineers
Я правильно понимаю, что это опенсорс, и его достаточно просто накатить и потестить?
Просто в JVM я откровенно слаб.
источник

AG

Arsen Gumin in Data Engineers
Доброй ночи, а сообщества нет никакого readme/faq с полезными ссылки или что-то в этом духе?
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ага. Просто создаёшь новый проект на котлине, добавляет зависимости (на API и на Spark), а дальше всё как обычно
источник

e

er@essbase.ru in Data Engineers
Ну там Oracle большими буквами написан.
источник

NN

No Name in Data Engineers
И что, что он там написан? Есть коммьюнити версия, например, и есть энтерпрайз.
источник

e

er@essbase.ru in Data Engineers
Ну в табличке , бесплатная даёт прирост 10%
источник

e

er@essbase.ru in Data Engineers
* хотя и это тоже супер интересно для больших кластеров
источник

ПФ

Паша Финкельштейн... in Data Engineers
Но платную тоже вероятно имеет смысл брать если это выгоднее железа получается
источник

e

er@essbase.ru in Data Engineers
Кстати а нет ли идеи продавать CO2 квоты для ИТ? Например оптимизнул расчет , съэклномил машиночасы - вот тебе денежка от тех кто считает все на условном "excel"
источник

ПФ

Паша Финкельштейн... in Data Engineers
Шипилёв некоторое время назад прицепил себе на гитхаб шильдик о том, сколько примерно энергии расходуют его билды на gh actions :)
источник

TC

Tasty Cake in Data Engineers
Привет всем. Получилось запустить ливи в докере. Причина была такая: у меня спарк работает под 2.12 скала. Последний бинарник ливи работает со скалой 2.11. В общем, пришлось с нуля делать докерфайл: выкачивается ливи из гитхаба, компилится. Получилось, в общем. Теперь другой вопрос: кто-то пробовал сабмитить джобы с библиотеками delta.io через livy?
источник

DS

Dmitriy Sh. in Data Engineers
Привет, а что можно прочитать о хадупе за 2-3 дня что бы разобраться почему таски стали делаться медленно?

Если есть какой-то гид по профилировщику джоб или по утилитам облегчающим взаимодействие с хадупом, то вообще хорошо.

На работе дали задачку выяснить почему джоба стала медленно выполняться, а я нифига не знаю
источник

DS

Dmitriy Sh. in Data Engineers
Короче нужна хорошая книжка по хадуп которую можно было бы быстро прочитать и стать хоть немного компетентным.

У меня например сейчас есть теория, что джобы стали медленнее из-за того что данных стало больше и нужно выделить памяти, но я эту теорию никак проверить не могу
источник