Size: a a a

2021 September 11

M

Mikhail in Data Engineers
Лучше скажи сколько ОЗУ))
источник

В

Вячеслав in Data Engineers
Это уже настолько толсто, что даже крыть нечем. :)
источник

ИК

Иван Калининский... in Data Engineers
А ведь я хотел кое-какие трансформации в итераторах InternalRow в мультитред запустить. Спасибо, буду осторожен.
источник

GP

Grigory Pomadchin in Data Engineers
это точно нельзя
или новый инстанс (пер партицию - хватит) или блокировки (зато пер экзекутор)

сериалайзеры (T => InternalRow) могут быть не тредсейфны по результату еще т.е. все InternalRow в резульатате будут одинаковые и заполнены последним обращением к сериалайзеру (это конечно смешно, т.е. сериалайзер ретернит пойнтер на буфер мутабельный)
источник

GP

Grigory Pomadchin in Data Engineers
^ ну собственно для этого есть _удобный_ метод .copy у InternalRow
источник

ИК

Иван Калининский... in Data Engineers
Этот метод стараются выполнять как можно реже, в ShuffleExchangeExec статический метод есть, который определяет, нужно копирование или нет.
источник

ИК

Иван Калининский... in Data Engineers
И в других местах наверняка есть такие проверки
источник

GP

Grigory Pomadchin in Data Engineers
конечно костыль
источник

ИК

Иван Калининский... in Data Engineers
Ох, да, когда вижу, что весь RDD из одинаковых записей (в тестах), значит забыл вызвать .copy, надо добавить где-то 😢
источник

GP

Grigory Pomadchin in Data Engineers
хорошая альтернатива шафл екчаенж ехеку 😄
источник

AZ

Anton Zadorozhniy in Data Engineers
На этапе развития бизнеса «можно сделать на чем угодно» наверное можно так использовать, да
источник

ПБ

Повелитель Бури... in Data Engineers
Можно пруфы? Я в хранилищах 10 лет и ни разу такого не видел
источник

AZ

Anton Zadorozhniy in Data Engineers
да это такое хранилище которое просто "навалим логов, сделаем дашбордов в кибане"
источник

AZ

Anton Zadorozhniy in Data Engineers
не Data Warehouse
источник

A

Aleksey in Data Engineers
Я кстати не первый раз слышу про использование эластика как “dwh”, но вот не понимаю какие при этом у эластика ограничения и преимущества перед mpp dbms. Можешь кратко поделиться?
источник

AZ

Anton Zadorozhniy in Data Engineers
Примерно как на КХ, делаешь декомпозированные индексы (джоины он не умеет), и дальше по ним делаешь агрегации, и в кибане смотришь
источник

N

Nikolay in Data Engineers
,Уже умеет )
источник

AZ

Anton Zadorozhniy in Data Engineers
Такая витрина на логах, спланк но труба пониже и дым пожиже
источник

D

Dmitriy in Data Engineers
вплане не умеет?
источник

D

Dmitriy in Data Engineers
вы про огранпченность алгоритмов или про что?
источник