Телеграмм чат группы hadoopusers страница 2172

Всем привет! А как лучше выгружать данные из вертики в сцилу (без кафок, для ад хок запросов)? Пока нашел copy для загрузки из вертики и cassandra-loader для выгрузки получившегося файлика, но выглядит топорно. Только чет свое через ждбс к касандре писать ?

источник

13:46пожаловаться #5

Uncel Duk in Data Engineers

Привет, кто какой стор используется для ресурсманагера?

источник

15:56пожаловаться #6

Uncel Duk in Data Engineers

Зукиперовский работает на “больших” кластерах? (тысячи/десятки тысяч задач в день)

источник

15:57пожаловаться #7

Alex in Data Engineers

вроде там там начинаются проблемы что он вычитать не может все данные
так как ожидает вытянуть одним запросом и нарывается на лимиты

поэтому у нас помнится сконфигурировано ограничение сколько в прошлое джобов хранить

источник

16:28пожаловаться #8

Uncel Duk in Data Engineers

Наступил на эти грабли, пробил лицо столом

источник

16:29пожаловаться #9

Uncel Duk in Data Engineers

С одной стороны не работает ( зарезали количество выполненных задач), с другой пользователям возможно важно посмотреть что там было с задачей неделю назад

источник

16:30пожаловаться #10

Uncel Duk in Data Engineers

( Без лазанья по /yarn/logs... )

источник

16:31пожаловаться #11

Alex in Data Engineers

а хистори сервер с этим не справляется?

источник

16:31пожаловаться #12

Uncel Duk in Data Engineers

Там грабли с зависимостями

источник

16:33пожаловаться #13

Uncel Duk in Data Engineers

И он вроде не эйчеется, могу ошибаться

источник

16:33пожаловаться #14

Alex in Data Engineers

ну у нас много через него уходит, для спарка так точно на спарк хистори, для обычных тоже вроде хистори настроен
50к+ в день (посмотрел между 4 утра и сейчас 8 вечера отработано 67к задач)

источник

16:36пожаловаться #15

Uncel Duk in Data Engineers

А какая версия хадупа на кластере ?

источник

16:40пожаловаться #16

Alex in Data Engineers

старая клоудерка 5.8 что-то, там вроде 2.6 хадуп крутится

источник

16:41пожаловаться #17

Uncel Duk in Data Engineers

Спасибо, покопаю в эту сторону

источник

16:42пожаловаться #18

Dasha in Data Engineers

Добрый день! Отправили к Вам из чата по Spark (хотя вопрос не про hadoop)

источник

17:12пожаловаться #19

Dasha in Data Engineers

Коллеги, добрый день!

Возникает ошибка при подключении к БД из Spark: java.lang.ClassNotFoundException: org.postgresql.Driver
При этом драйвер установлен и подключен:

import java.util.Properties

val connectionProperties = new Properties()
connectionProperties.setProperty("Driver", "org.postgresql.Driver")

=>
import java.util.Properties
connectionProperties: java.util.Properties = {Driver=org.postgresql.Driver}
res5: Object = null

источник

17:12пожаловаться #20