Size: a a a

2021 July 08

T

T in Moscow Spark
Ну то есть просту потом в листбуфер результат на пихать?
источник

GP

Grigory Pomadchin in Moscow Spark
не понял
источник

GP

Grigory Pomadchin in Moscow Spark
в чем вопрос?)
источник

GP

Grigory Pomadchin in Moscow Spark
смотри там когда делаешь форич партишен - внутри у тебя итератор
итератор ленив
мап по итератору ленив
форич по итератору жадный
источник

T

T in Moscow Spark
Ну смотри мне надо собрать для каждой партиции некий результат и запушить его в другую систему
источник

T

T in Moscow Spark
а понял
источник

GP

Grigory Pomadchin in Moscow Spark
ага; если ты сделаешь iterator.toList это тож норм будет к слову
источник

GP

Grigory Pomadchin in Moscow Spark
если у тебя чтото IO интенсвное внутри такой партиции происходит - т.к. тебе кудато надо пушить

то у тебя CPU скорее всего почти не тратится

нет ничего зазорного чтоб в таком партишене твои риквесты распаралелить
источник

GP

Grigory Pomadchin in Moscow Spark
так что смело там можешь норм либы испольлзовать) и паралельно обрабатывать итератор
источник

T

T in Moscow Spark
у меня кстати падает но там не понятно либо данные не очень либо спарк 3 чудит
источник

T

T in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
хм ясно
источник

GP

Grigory Pomadchin in Moscow Spark
а сделай просто iterator.foreach(println)
источник

GP

Grigory Pomadchin in Moscow Spark
простой самый
источник

GP

Grigory Pomadchin in Moscow Spark
еще может тип не тот конечно
источник

T

T in Moscow Spark
Таже ошибка
источник

GP

Grigory Pomadchin in Moscow Spark
а сделай на тупом датафрейме
источник

GP

Grigory Pomadchin in Moscow Spark
каокмнить
источник

GP

Grigory Pomadchin in Moscow Spark
есть репродьюсбл пример?
источник

T

T in Moscow Spark
ага щас так и сделаю
источник