Телеграмм чат группы hadoopusers страница 2201

2020 April 01

GP

Grigory Pomadchin in Data Engineers

Логи зепелина над смотреть, там будет полный Трейс

источник

15:26пожаловаться #1

A

Alexander in Data Engineers

Alex

поднять уровень логирования до debug/trace и посмотреть что пишет
обычно хоть что-то да пишется

таки нашел логи, спасибо

источник

15:30пожаловаться #2

DS

Dmitriy Solodukha in Data Engineers

Прошу обратную связь от Сообщества.

Dark Side Cloud (рабочее название)
Визуальный конструктор облачной архитектуры. Автоматизируем создание, управление и деплой серверной инфраструктуры.

1. Сокращает время создания и настройки облачной инфраструктуры.
2. Вы всегда в курсе текущей структуры проекта.
3. Не нужен системный администратор.

Теперь вы видите как устроен ваш cloud formation: весь целиком и как работают его отдельные части. Визуально. Библиотека готовых решений. Можно доработать и задеплоить одной кнопкой.

Работайте с облачной инфраструктурой как с конструктором сайтов.

Подробнее здесь: https://bit.ly/dscloud-ru

источник

19:07пожаловаться #3

OD

Olga Deykun in Data Engineers

Dmitriy Solodukha

Прошу обратную связь от Сообщества.

Dark Side Cloud (рабочее название)
Визуальный конструктор облачной архитектуры. Автоматизируем создание, управление и деплой серверной инфраструктуры.

1. Сокращает время создания и настройки облачной инфраструктуры.
2. Вы всегда в курсе текущей структуры проекта.
3. Не нужен системный администратор.

Теперь вы видите как устроен ваш cloud formation: весь целиком и как работают его отдельные части. Визуально. Библиотека готовых решений. Можно доработать и задеплоить одной кнопкой.

Работайте с облачной инфраструктурой как с конструктором сайтов.

Подробнее здесь: https://bit.ly/dscloud-ru

👍

источник

19:15пожаловаться #4

A

Alex in Data Engineers

бла-бла-бла

источник

19:23пожаловаться #5

A

Alex in Data Engineers

а где видео или хотя бы скрины?

источник

19:23пожаловаться #6

A

Alex in Data Engineers

я понимаю что ещё не готово, но концепт то уже должен быть или “подключиться” это дать денег на идею даже без мокапов?

источник

19:24пожаловаться #7

DZ

Dmitry Zuev in Data Engineers

а кто нибудь дружил Clickhouse и спарк

источник

19:35пожаловаться #8

N

Nikolay in Data Engineers

Да. У нас КХ и Спарк

источник

19:38пожаловаться #9

DZ

Dmitry Zuev in Data Engineers

как льете в кх?

источник

19:39пожаловаться #10

AK

Andrew Kochen in Data Engineers

я писал плагин для КХ и Спарка

источник

19:41пожаловаться #11

DZ

Dmitry Zuev in Data Engineers

Andrew Kochen

я писал плагин для КХ и Спарка

есть сурсы? Что он делал?

источник

19:41пожаловаться #12

AK

Andrew Kochen in Data Engineers

Dmitry Zuev

есть сурсы? Что он делал?

сейчас работаю над тем, чтоб заопенсорсить

источник

19:42пожаловаться #13

N

Nikita Blagodarnyy in Data Engineers

Граждане, дайте совет. Задача такая.
Есть таблица X. Живет в HBase, rowkey некий guid, всего ~16 млрд. Переливается инкрементно в КХ.
Есть вторая таблица X_HIST - история событий, произошедших в жизни X. Живёт в HBase, rowkey (guid X; тип события - 0,1,2,N ; ts события). Тоже переливается инкрементно в КХ. Всего ~40 млрд событий. В месяц где-то по 1,5 млрд подвозят новых.

Из множества X_HIST довольно недорого выделяется инкремент ~3 млн. и отклыдвается в сторону. После этого из него отбираются события с типом 6 (1,5 млн). Задача-по каждому такому событию слазить в полную историю X_HIST и посмотреть, что было раньше события 6. Ну, например, посчитать количество событий типа 2 и найти дату самого раннего события с типом 0.
На КХ пакетно это не поехало, не лезет в память.

Вопрос-как и на каких компонентах более лутше все это запилить? В голову приходят HBase MR, мультитредовый самопис на HBase API, spark-вычитать инкремент и потом map/forEach.

источник

19:42пожаловаться #14

AK

Andrew Kochen in Data Engineers

в плане записи , например. позволял записывать записи в различных шарды по различным стратегиям шардирования

источник

19:42пожаловаться #15

DZ

Dmitry Zuev in Data Engineers

Andrew Kochen

сейчас работаю над тем, чтоб заопенсорсить

что там конкретно? Пушдаун? Лоадинг какой-то?