Size: a a a

2021 September 10

GP

Grigory Pomadchin in Data Engineers
я попробую у меня точно пер роу я об этом просто не подумал
источник

GP

Grigory Pomadchin in Data Engineers
углядел)
источник

GP

Grigory Pomadchin in Data Engineers
ну как вариант похоже можно кешировать их, тогда будет пер жвм кеш
но блокировать обращения к ним

не знаю на сколько это быстро будет но точно выглядит костылем)
источник

GP

Grigory Pomadchin in Data Engineers
хотя они сами кешировали их в определенных версиях
источник

A

Aleksey in Data Engineers
В https://t.me/datajobs спросите
источник

M

Mi in Data Engineers
ой, прошу прощения, чатиком ошибся
источник

AG

Arsen Gumin in Data Engineers
Вопрос, вот pyspark работает на cpu как я понял, а есть либы которые работают на gpu(rapids например), явно работа на гпу с точки зрения параллелизма эффективнее, но почему спарк так популярен? Ни у кого нет денег сделать гпу дата центр? Или я что-то не понимаю
источник

Б

Борис in Data Engineers
Мне кажется задачи решаемые на cpu и gpu отличаются.
источник

B

BadRat in Data Engineers
Спарк может работать и на гпу
источник

AG

Arsen Gumin in Data Engineers
Эффективно? Или просто может
источник

B

BadRat in Data Engineers
Вроде эффективно но не для любой задачи
источник

AG

Arsen Gumin in Data Engineers
Ну я поясню, вот я пользовался одно время тензорфлоу(не сильно плотно) в 100% задач, на гпу все работало шустрее
источник

AG

Arsen Gumin in Data Engineers
Операции на матрицами и подбор гиперпараметров
источник

B

BadRat in Data Engineers
Apache Spark 3.0:For Analytics & Machine Learning | NVIDIA
https://www.nvidia.com/en-us/deep-learning-ai/solutions/data-science/apache-spark-3/
источник

B

BadRat in Data Engineers
Вот нвидия двигает тему для мл
источник

AZ

Anton Zadorozhniy in Data Engineers
Спарк обычно делает другое, унылые джоины, немножко string manipulation, ну и сжатие/разжатие
источник

GP

Grigory Pomadchin in Data Engineers
для МЛ спарк не более популярен
источник

AG

Arsen Gumin in Data Engineers
Ля, спасибо) просто пол книжки прочитать ток успел по Спарку, вопрос не дал покоя
источник

AZ

Anton Zadorozhniy in Data Engineers
Вообще редкость по моей практике, мб щас стало лучше
источник

GP

Grigory Pomadchin in Data Engineers
+ (к редкости)
источник