Евгений Глотов
pyspark включённым pyspark.virtualenv позволяет развернуть на каждой ноде нужный энвайронмент и запускать там код, использующий нужные либы, например, с помощью pandas_udf, или обычной udf, или вообще на rdd
Спасибо. На всякий случай спрошу, если python либы очень специфические, типа BERT-а, то на PySparke всё равно их можно запустить?