Телеграмм чат группы moscowspark страница 106

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2019 April 08

PK

Pavel Klemenkov in Moscow Spark

Наша специализация выгодно отличаются от других тем, что домашние задания принимаются на настоящем кластере. Это, конечно, приносит определенную боль, но очень полезный навык.

источник

15:57пожаловаться #1

AV

Artyom Vybornov in Moscow Spark

KrivdaTheTriewe

@pklemenkov вы нашли чем скедулить стриминг джобы и перезапускать их

Хм, supervisor или rc.d или что-то на мотив, чем не подходит?

источник

16:07пожаловаться #2

K

KrivdaTheTriewe in Moscow Spark

Artyom Vybornov

Хм, supervisor или rc.d или что-то на мотив, чем не подходит?

ну вот вы ноду уронили, а ярн задача работает

источник

16:08пожаловаться #3

AA

Alexander Ayoupov in Moscow Spark

Коллеги, кто-то из вас использовал MinHashLSH на спарк 2.3.2?

источник

16:37пожаловаться #4

t

tenKe in Moscow Spark

Pavel Klemenkov

@tenKe так ведь?

угу

источник

16:40пожаловаться #5

AI

Andrei Iatsuk in Moscow Spark

KrivdaTheTriewe

два года назад мы подымали короч крон , который ходил в ярн и смотрел джобу по имени, если нет запускал

как-нибудь решили по-другому?)

источник

16:40пожаловаться #6

PK

Pavel Klemenkov in Moscow Spark

Alexander Ayoupov

Коллеги, кто-то из вас использовал MinHashLSH на спарк 2.3.2?

Я нет, а в чем вопрос, интересно?

источник

16:44пожаловаться #7

AA

Alexander Ayoupov in Moscow Spark

Pavel Klemenkov

Я нет, а в чем вопрос, интересно?

Есть любопытная недетерминированность у SortMergeJoin внутри спарковского алгоритма. Количество получаемых записей расходится от запуска к запуску, seed для хэш-функций тот же, данные те же, количество расходится, но примерно стабильное

источник

16:47пожаловаться #8

PK

Pavel Klemenkov in Moscow Spark

Если seed один и тот же, то забавно. Вообще в реализации minhash довольно просто накосячить

источник

16:49пожаловаться #9

AA

Alexander Ayoupov in Moscow Spark

Pavel Klemenkov

Если seed один и тот же, то забавно. Вообще в реализации minhash довольно просто накосячить

Ладно, буду копать дальше

источник

16:50пожаловаться #10

ЕГ

Евгений Глотов... in Moscow Spark

А вы на пайспарке?

источник

16:51пожаловаться #11

ЕГ

Евгений Глотов... in Moscow Spark

Вдруг там pythonhashseed где-то внутри используется)

источник

16:51пожаловаться #12

AA

Alexander Ayoupov in Moscow Spark

Евгений Глотов

А вы на пайспарке?

Не, скала

источник

16:58пожаловаться #13

DG

Denis Gabaydulin in Moscow Spark

KrivdaTheTriewe

@pklemenkov вы нашли чем скедулить стриминг джобы и перезапускать их

Мы сделали такую стратегию.

У нас есть watcher, который следит за streaming query (смотрит его стейт периодически). Внутри все это оформлено в такую стейт машину:
-> INITIAL
INITIAL -> (RUNNING|FATAL_ERROR)
RUNNING -> (RUNNING|RECOVERABLE_ERROR|FATAL_ERROR)
RECOVERABLE_ERROR -> (RUNNING|RECOVERABLE_ERROR|FATAL_ERROR)
FATAL_ERROR -> EXIT

Если случилась RECOVERABLE_ERROR то попытаемся поднять streaming query.
Если FATAL_ERROR, то завершаем все queries в текущем апе и выходим.

RECOVERABLE_ERROR - это практически любая ошибка, которая вызвала штатную остановку streaming query извне (самим спарком).
FATAL_ERROR - это либо n раз провалились при попытке подняться из RECOVERABLE_ERROR, либо был какой-то unhandled exception.

Почему так?
1. Стейт у streaming query мало информативен на самом деле. Если джоба упала по случайности (партиция кафки например поменяла лидера), то эта одна история, а если в пайплайне ошибка или беда с wal, то совсем другая. Разбираться человеку легко, автоматически - сложно.

2. У нас как правило в каждом апе минимум 3 queries, потому что 3 разных кластера кафки (в разных dc). Поэтому ситуация когда какой-то query припал, возможно (например учения в dc).

3. Таймаут между рестартами полезен, за это время можно что-нибудт починить :-)

4. Чтобы не мучаться с перезапуском всего, проще в случае FATAL_ERROR аккуратно выйти, а потом cron/ваш любый планировщик увидит что джобы нет и запустит ее.

источник

17:23пожаловаться #14

DG

Denis Gabaydulin in Moscow Spark

p.s. Watcher и стейт машина естественно находятся внутри апа.

источник

17:25пожаловаться #15

K

KrivdaTheTriewe in Moscow Spark

пасибо

источник

18:04пожаловаться #16

SO

Simon Osipov in Moscow Spark

Ребят, есть вопрос.
Python, Spark, Postgres.

Скачал драйвер, закинул в конфиг. Поднял туннель, подключился к бд, пытаюсь переложить Spark DF в Postgres используя драйвер.

Всё отрабатывает, не падает, код после df.write.jdbc отрабатывает, что в df действительно есть данные убедился. Однако в бд - пусто.

Куда смотреть? Как то можно в консоль вывести что происходит под капотом у write?

источник

18:53пожаловаться #17

KS

Kostya Shchetkin in Moscow Spark

Ребят, есть вопрос.
Python, Spark, Postgres.

Скачал драйвер, закинул в конфиг. Поднял туннель, подключился к бд, пытаюсь переложить Spark DF в Postgres используя драйвер.

Всё отрабатывает, не падает, код после df.write.jdbc отрабатывает, что в df действительно есть данные убедился. Однако в бд - пусто.

Куда смотреть? Как то можно в консоль вывести что происходит под капотом у write?

Я прям точно не помню, но это кажется связано, с тем, что не коммитится транзакция

источник

18:59пожаловаться #18

KS

Kostya Shchetkin in Moscow Spark

Скинь кусок кода, где пишешь данные

источник

19:02пожаловаться #19

SO

Simon Osipov in Moscow Spark

Kostya Shchetkin

Я прям точно не помню, но это кажется связано, с тем, что не коммитится транзакция

.save() должен быть?

источник

19:02пожаловаться #20