Size: a a a

2019 March 20

N

Nikolay in Moscow Spark
Без индекса он бесполезен в основном
источник

PK

Pavel Klemenkov in Moscow Spark
Nikolay
Нестед луп ест в базах. Обычно в нем используется индекс.
Ну он квадратичный, но, зато, универсальный.
источник

DG

Denis Gabaydulin in Moscow Spark
По формату, это скорее не hash map, а columnar storage с отимизациями, типа пуш даун предиката, которые "вшиты" в код через кодогенерацию. По крайней мере, я так это понял когда ковырялся со сгенеренным кодом (искал баг).
источник
2019 March 21

GP

Grigory Pomadchin in Moscow Spark
Евгений Глотов
А что, тунгстен до сих пор существует? Он разве не превратился в каталист?
Каталист это деревьев оптимайзер
источник

N

Nikolay in Moscow Spark
Подскажите. Можно ли а json сделать inferschena не по всему документу, а только по его части ?
источник

EN

Eldar Nezametdinov in Moscow Spark
Nikolay
Подскажите. Можно ли а json сделать inferschena не по всему документу, а только по его части ?
источник

N

Nikolay in Moscow Spark
А на скале также ?
источник

EN

Eldar Nezametdinov in Moscow Spark
источник

N

Nikolay in Moscow Spark
Спасибо
источник
2019 March 22

N

Nikolay in Moscow Spark
Есть файл json. 3g.падает обработка c out of memory.
источник

N

Nikolay in Moscow Spark
Подскажите. Может как то можно его одним воркером?
источник

AI

Andrei Iatsuk in Moscow Spark
Мало инфы. В какой формат сохраняешь? Какие трансформации применяешь? Размер объектов в json примерно одинаков или есть крупные выбросы? Если разбить на 10 файлов, то по отдельности все выполнятся?
источник

N

Nikolay in Moscow Spark
Есть файл. Формат json. Весит 3гига. Обрабатывается одним воркером. Падает по нехватке памяти
источник

AI

Andrei Iatsuk in Moscow Spark
Это ни о чем не говорит. У меня csv на 200 гигов обрабатывался одним воркером.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Может он гзипованный 3гб весит?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Тогда на распаковке упадёт
источник

AI

Andrei Iatsuk in Moscow Spark
Я и говорю, что мало инфы. Тут на кофейной гуще можно гадать.
источник
2019 March 26

Sa

Salam andra in Moscow Spark
Всем привет, подскажите пожалуйста, где можно взять structure streaming source Cassandra
источник

t

tenKe in Moscow Spark
Самому писать надо, нет такого :)
источник
2019 March 27

Sa

Salam andra in Moscow Spark
Благодарю)
источник