Size: a a a

2021 October 18

GP

Grigory Pomadchin in Moscow Spark
ну понятно да
источник

GP

Grigory Pomadchin in Moscow Spark
слушай ну ясно
источник

GP

Grigory Pomadchin in Moscow Spark
блин но мне кажется в этом случае кодоген не самое медленное
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Да мне кажется насчёт кодогена можно вообще не переживать )))
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну типа на фоне всего остального кодоген теряется, это ну там секунда
источник

GP

Grigory Pomadchin in Moscow Spark
не совсем
источник

GP

Grigory Pomadchin in Moscow Spark
типо вот смотри у тебя считай dataset
источник

GP

Grigory Pomadchin in Moscow Spark
или датафрейм
источник

GP

Grigory Pomadchin in Moscow Spark
и тебе хочется применить функцию к чемуто
источник

GP

Grigory Pomadchin in Moscow Spark
и ты такой оке вот мой экспрешн
экспрешн внутри выдрегивает из памяти спарка то что ей надо (deserialize из InternalRow) изменяет чтото и пакует в InternalRow

эти сер десеры они генерят код и компилят его

прикинь у тебя внезапно функции колл станет пер итем в твоем датафрейме - тогда секунда будет иметь значение)
источник

GP

Grigory Pomadchin in Moscow Spark
понятно что это не относится - наверное  (вообще вроде экспры некоторые могут делать кодогены вроде) - к кодоген стейджу)
источник

GP

Grigory Pomadchin in Moscow Spark
но вот эта вся хурма с кодеками и конвретацией из внутреннего спарк представления в жвм репр явно поломана както
источник

GP

Grigory Pomadchin in Moscow Spark
я к тому что типо кодоген наверное 0.03 мс а потом еще секу компилить)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Не, там очень быстрый компилятор же
источник

GP

Grigory Pomadchin in Moscow Spark
hz; ниоч; иногда больше секунды даже
источник

GP

Grigory Pomadchin in Moscow Spark
на самом деле при таких числах даже пол секунды дорого
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Не верю
источник

GP

Grigory Pomadchin in Moscow Spark
лол; я не могу примера тебе показать
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Компиляция даже большой кодобазы это считанные секунды, а тут тривиальный код
источник

GP

Grigory Pomadchin in Moscow Spark
но десериализаторы мне пришлось кешировать по тредно
источник