Size: a a a

2021 February 28

NN

No Name in Data Engineers
Grigory Pomadchin
Мне кажется куб подпилили уже))
А что вообще почитать про то, что в куб стоит пихать и в каких случаях, а что - в ярн?
источник

GP

Grigory Pomadchin in Data Engineers
No Name
А что вообще почитать про то, что в куб стоит пихать и в каких случаях, а что - в ярн?
в ярн ничо не над пихать) старая какашка)
пихать тудаможно если легаси или емр у вас
источник

NN

No Name in Data Engineers
Grigory Pomadchin
в ярн ничо не над пихать) старая какашка)
пихать тудаможно если легаси или емр у вас
Ну как...у нас вот сервера хадупа в большом количестве он-прем, и облака не светят. Спарк там гоняем, все дела. Ну и, как я понимаю, ярн с этим делом изначально норм дружит. Кубер в этом случае будет лучше? Или как раз тем кейсом, когда в него все подряд валят.
источник

A

Alex in Data Engineers
Grigory Pomadchin
Или прост неравномерно размазанные жобы
Там же как и в спарке пару типов воркеров/контейнеров

Условно драйвер ничего не есть, а воркер выжирает cpu, если ещё и нагрузка перекошена после какого group by то вообще весело
источник

A

Alex in Data Engineers
В спарке но за счёт микробатчей может быть более ровно, а вот во флинке с его "задеплоили топологию и полетели" (как в шторме было) это может хорошо перекосы вызывать
источник

AK

Artem Kravets in Data Engineers
Ребят, всем привет! Буквально только начал во всё это втягиваться. Есть программа, которая берёт на вход статьи из wiki, и считает количество статей в котором упоминался хотябы раз какой то язык программирования. Ну и сделано это 3 разными функциями ранжирования. Но я не сильно ещё разбираюсь, что из себя какие методы представляют под капотом, и не понимаю, как там происходят вычисления. Поэтому может кто пожалуйста уделить 5-10 минут, и проконсультировать, почему какой метод быстрее работает?🙏🏻
источник

K

KrivdaTheTriewe in Data Engineers
Grigory Pomadchin
в ярн ничо не над пихать) старая какашка)
пихать тудаможно если легаси или емр у вас
Ты зря так говоришь , ярн достаточно хорошая вещь и надёжная
источник

K

KrivdaTheTriewe in Data Engineers
Пока ярн справляется с etl лучше куба
источник

K

KrivdaTheTriewe in Data Engineers
Плюс вещи типа докер контейнеров и прочее появились уже давно
источник

AZ

Anton Zadorozhniy in Data Engineers
Mikhail Kuznetsov
Scala for impatient мне не понравилась - очень рваная подача материала. И зачем коты в де ?)
Frameless довольно удобный, если все на нем написано, референсы к колонкам на этапе компиляции, аккуратнее работа с энкодерами сделано; я дописывал джобов в одном месте, мне понравилось
источник

AZ

Anton Zadorozhniy in Data Engineers
(на вкус и цвет конечно)
источник

AZ

Anton Zadorozhniy in Data Engineers
Хочу вот против нашей базы дописать прототип typed dataset, чтобы без спарка, но времени никак найти не могу
источник

K

KrivdaTheTriewe in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Grigory Pomadchin
в ярн ничо не над пихать) старая какашка)
пихать тудаможно если легаси или емр у вас
а куда деваться с бареметалом? минио + спрак он кубер?
источник

K

KrivdaTheTriewe in Data Engineers
ярн + хдфс - братья навек
источник

NN

No Name in Data Engineers
Nikita Blagodarnyy
а куда деваться с бареметалом? минио + спрак он кубер?
Вот я тоже самое спросил, а меня проигнорили (
источник

GP

Grigory Pomadchin in Data Engineers
Nikita Blagodarnyy
а куда деваться с бареметалом? минио + спрак он кубер?
похоже да)
источник

GP

Grigory Pomadchin in Data Engineers
но был ж на спаркоконфе толк о хдфс в кубере
источник
2021 March 01

N

Nikita Blagodarnyy in Data Engineers
Это может выглядеть оправданным, когда нет своей инфры. Типа сидишь ты такой аналист в финансовом департаменте, прошёл курсы по пуспарку, решил лайтгбм наговнякать из своих цсв, а негде. Попросил в общеказеном опеншифте себе ресурсов и развлекаешься. Когда стоят свои сервера, зачем запускать датаноды через прослойку?
источник

А

Александр in Data Engineers
☭ ⤳ λ Shinkevich
По мне, так для спарка хватит книжки тип Scala for impatient (Скала для занятых). Если есть бекграунд в других языках, то самое то, чтобы въехать... А дальше уже красная книга и коты ;)
Спасибо большое, нашел эту книгу и 4 издание от создателя языка
источник