Size: a a a

2021 October 09

ЕГ

Евгений Глотов... in Data Engineers
Не, ну можно по одной записи сразу сливать в фс, но хадуп спасибо не скажет ведь за такое
источник

DZ

Dmitry Zuev in Data Engineers
Да, но может на маленьком буфере жить.
источник

GP

Grigory Pomadchin in Data Engineers
да
источник

DZ

Dmitry Zuev in Data Engineers
Почему, делаешь буфер размером с блок
источник

DZ

Dmitry Zuev in Data Engineers
Какие у вас блоки? Больше 200мб?
источник

GP

Grigory Pomadchin in Data Engineers
ну ты верно говоришь
спарк даст преимущество если ты схему как грузить паралельно в память сможешь / можешь сделать и потом как паралельно еще все это синкать

в других случаях бред (оч мног памяти вникуда) он еще и рухнуть может по дороге
источник

ЕГ

Евгений Глотов... in Data Engineers
Были 256
источник

ЕГ

Евгений Глотов... in Data Engineers
Ща 128
источник

ЕГ

Евгений Глотов... in Data Engineers
Перешёл в компанию по менбше😆
источник

DZ

Dmitry Zuev in Data Engineers
А запуск спарка это 1гб на экзекутор, и чтобы записать 128мб, у тебя будет гиг на рантайм
источник

ЕГ

Евгений Глотов... in Data Engineers
Блин ну ребят мы не в 85 году
источник

GP

Grigory Pomadchin in Data Engineers
нажал репартишон и он упал с OOM
источник

ЕГ

Евгений Глотов... in Data Engineers
6 гигов на вкор в наличии
источник

DZ

Dmitry Zuev in Data Engineers
Но зочем, вот у нас в моменте может ехать 3-4тб сыряка из бд, сколько нужно памяти по твоей схеме?
источник

ЕГ

Евгений Глотов... in Data Engineers
Что значит в моменте?
источник

DZ

Dmitry Zuev in Data Engineers
В один момент надо стартануть выгрузку 3-4тб из нескольких бд
источник

ЕГ

Евгений Глотов... in Data Engineers
Я утверждаю, что можно взять твой ноут и спарком перегнать 3тб из реляционки на жёсткий
источник

ЕГ

Евгений Глотов... in Data Engineers
Если правильно настроить спарк-сессию и запрос
источник

DZ

Dmitry Zuev in Data Engineers
До можно, но если это несколько бд то ты получишь по спаркаппу на бд
источник

DZ

Dmitry Zuev in Data Engineers
Или даже на таблицу
источник