Size: a a a

2019 September 29

ТС

Тимофей Смирнов in Data Engineers
так как overhead 0.4 и т.д
источник

СХ

Старый Хрыч in Data Engineers
но проблема в том, что например задача забрать 35 гб данных из источника, а воркеру всего выдано 20
источник

СХ

Старый Хрыч in Data Engineers
если бы была просто вируалка, она бы записала излишки на nvme
источник

СХ

Старый Хрыч in Data Engineers
задачи  падают на воркеры рандомно
источник

СХ

Старый Хрыч in Data Engineers
и заранее знать сколько будут весить ключи нельзя
источник

ТС

Тимофей Смирнов in Data Engineers
вроде есть offHeap memory, не то что надо ?
источник

СХ

Старый Хрыч in Data Engineers
Тимофей Смирнов
вроде есть offHeap memory, не то что надо ?
это работало бы на виртуалке
источник

СХ

Старый Хрыч in Data Engineers
а мы сейчас в контейнере
источник

ТС

Тимофей Смирнов in Data Engineers
хм, таких проблем не было, у нас заранее известно нужное количество памяти
источник

СХ

Старый Хрыч in Data Engineers
просто ключи в сцилле могут весить как 15кб так и 50 мб
источник

СХ

Старый Хрыч in Data Engineers
то есть заранее сказать, сколько будет весить выборка нельзя
источник

СХ

Старый Хрыч in Data Engineers
считать размер выборки и создавать контейнер в воркером нужного размера - выглядит жесть
источник

K

KrivdaTheTriewe in Data Engineers
Старый Хрыч
но проблема в том, что например задача забрать 35 гб данных из источника, а воркеру всего выдано 20
Вы представляете как Спарк работает ?
источник

СХ

Старый Хрыч in Data Engineers
KrivdaTheTriewe
Вы представляете как Спарк работает ?
очень плохо, я его ток ставил и мониторил, яж не пишу под под это
источник

K

KrivdaTheTriewe in Data Engineers
Старый Хрыч
очень плохо, я его ток ставил и мониторил, яж не пишу под под это
Ему не нужно памяти столько сколько в датасете
источник

СХ

Старый Хрыч in Data Engineers
KrivdaTheTriewe
Ему не нужно памяти столько сколько в датасете
а куда он денет данные? вот предположим, есть сцилла и надо забрать 3,5 млрд ключей, и сделать из них 12 графиков и отчёт
источник

K

KrivdaTheTriewe in Data Engineers
На локальный кеш положит ?
источник

СХ

Старый Хрыч in Data Engineers
KrivdaTheTriewe
На локальный кеш положит ?
в контейнере?
источник

СХ

Старый Хрыч in Data Engineers
не, если бы была вм, то всё понятно
источник

ТС

Тимофей Смирнов in Data Engineers
а нельзя увеличить количество контейнеров ?
источник