Size: a a a

2021 July 23

ММ

Максим Мартынов... in Moscow Spark
spark.driver.* относится, очевидно, к драйверу
источник

VI

Vladimir Ilyushkin in Moscow Spark
Коллеги, всем привет. Кто нибудь сталкивался с вычитыванием большого объёмаема данных, когда на кластере допустим 512гб памяти 1тб места уровень репликации 1. Джоиню две таблички по 1тб каждая кластер ложится. Куда копать?
источник

М

Мохаммад Реза... in Moscow Spark
Hi,
Anyone has experience with Redis and Spark?
I am using "Jedis Pool" for key lookup and key update. But sometimes the program stuck in a stage and threads block waiting for connection.
Any suggestion for a Redis client good for Spark? I use Scala.



Здравствуй,
У кого-нибудь есть опыт работы с Redis и Spark?
Я использую «Пул джедаев» для поиска и обновления ключей. Но иногда программа застревает в стадии и потоки блокируются в ожидании подключения.
Есть какие-нибудь предложения по клиенту Redis, подходящему для Spark? Я использую Scala.
источник

GP

Grigory Pomadchin in Moscow Spark
а https://github.com/RedisLabs/spark-redis не подходит? можно пользоваться как минимум как вдохновлением для своего велосипеда если надо
источник

М

Мохаммад Реза... in Moscow Spark
Спасибо, Грегори
Я использую его для записи / чтения всего RDD.
Могу ли я использовать его для поиска по одному ключу и записи по одному ключу? скажем для каждого раздела.
источник

GP

Grigory Pomadchin in Moscow Spark
о, все я понял тебя;
хм непонятно а как у тебя подвисает? попробуй засетить setMaxWaitMillis может айдлы отваливаются какие
я помню раньше это была проблема jedis
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Why don't you folks speak in English? Looks like it might me easier for both parts
источник

GP

Grigory Pomadchin in Moscow Spark
хз он по русски пишет и имя на русском, может хочется автору
источник

GP

Grigory Pomadchin in Moscow Spark
так конечно пусть на любом языке пишет каком удобнее
источник

PK

Pavel Klemenkov in Moscow Spark
I think they speak French in Philadelphia))
источник

GP

Grigory Pomadchin in Moscow Spark
they call it philadelphian
источник

АК

Александр Кунцевич... in Moscow Spark
Коллеги, а никто не настраивал динамическое распределение ресурсов для SPARK на YARN (все ванильное). Включаю spark-defaults.conf, как пишет Cloudera и задача выполняется бесконечно.
источник

М

Мохаммад Реза... in Moscow Spark
Sorry. I know Russian very little and lost the motivation to learn more. but sometimes explore Russian communities.
Anyways it is a Rus chat and I respect it.
I am okay in using a translator, so be at ease.
источник

М

Мохаммад Реза... in Moscow Spark
I will try it. I already set the MaxIdle and MaxTotal to 8000!
I use different datasets and I face this problem everytime.
источник

GP

Grigory Pomadchin in Moscow Spark
how about setting it to 500ms?
источник

М

Мохаммад Реза... in Moscow Spark
I don't have a accurate number. but this happens. stuck at a stage.
источник

М

Мохаммад Реза... in Moscow Spark
источник

М

Мохаммад Реза... in Moscow Spark
I change them to a higher value, but it fix temporary.
Someone suggested me to use Lettuce Async client.
источник

ЕГ

Евгений Глотов... in Moscow Spark
На кластере 1ТБ места
Джойнишь 2 таблички по 1ТБ?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Может 1ПБ?
источник