Size: a a a

2021 September 08

AZ

Anton Zadorozhniy in Data Engineers
Думаю вы шутите, но я в своей практике понаписал всяких таких утилит на го, эрланге, плюсах; когда явно задача против шерсти хадуперскому стеку выигрыш может быть большим
источник

AZ

Anton Zadorozhniy in Data Engineers
И не через пайп, вы можете гошечкой достать разные части файла из объектного стораджа
источник

Д

Дмитрий in Data Engineers
Нет, я не шучу, действительно я понимаю что будет быстрее. И действительно я оставил это на последний шанс.
источник

Д

Дмитрий in Data Engineers
Я имел ввиду rdd.pipe.
источник

Д

Дмитрий in Data Engineers
Даже в сторадж не ложить.
источник

Д

Дмитрий in Data Engineers
Хотя с pipe косяк, если файл zip будет больше 2GB, то rdd может сломаться, так как размер блока шафла до 2GB.
источник

AZ

Anton Zadorozhniy in Data Engineers
Я бы записал кусочки с максимальным параллелизмом в спарке, а потом запускал монолитную выгружалку (ещё и на отдельной очень быстрой по CPU/IO эдж ноде)
источник

AZ

Anton Zadorozhniy in Data Engineers
Писал когда-то на го обстукивалку многих экземпляров ПГ, чтобы scoop не дергать, был большой успех
источник

Д

Дмитрий in Data Engineers
Да сейчас так и сделано, параллелизм обработки высокий, это уже не горлышко, а вот зиповалка это да. Пред ней приходится собирать все в одну партицию, но это быстро. А потом пихать в поток zip. это пока самое тонкое место.
источник

Д

Дмитрий in Data Engineers
@dartov А за go спасибо, возьму на зиму для изучения 👍
источник
2021 September 09

T

T in Data Engineers
Привет чат,
Накидайте пожалуйста книг, видео, статей по флинку которые вам понравились
источник

ИК

Иван Калининский... in Data Engineers
источник

А

Алмас in Data Engineers
Hah, fake?)
Удалите если fake:)
источник

OI

Oleg Ilinsky in Data Engineers
это фишинг
источник

N

Nikita Blagodarnyy in Data Engineers
Не, ты че, чистая правда.
источник

OI

Oleg Ilinsky in Data Engineers
у меня так друг разбогател
источник

А

Алмас in Data Engineers
😄😄😄
источник

N

Nikita Blagodarnyy in Data Engineers
Елон?
источник

AZ

Anton Zadorozhniy in Data Engineers
Виталик наверное
источник

ЕГ

Евгений Глотов... in Data Engineers
А комбот умеет картинки сравнивать и удалять?
источник