Телеграмм чат группы data_architect страница 20

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Архитектура данных

314 membersпожаловаться на группу

1
«
…
‹
15
16
17
18
19
20
21
›
…
»

2018 July 08

DT

Denis Troyan in Архитектура данных

Andrey Shevchenko

Тогда никаких

а как с отказоустойчивостью, exactly-once процессингом и контролем последовательного процессинга и записи?

источник

21:33пожаловаться #1

DT

Denis Troyan in Архитектура данных

не будет ли приколов в виде deadlock’ов при распределенном процессинге в spark, все ноды которого сливают в одну mysql табличку?

источник

21:34пожаловаться #2

AS

Andrey Shevchenko in Архитектура данных

а как с отказоустойчивостью, exactly-once процессингом и контролем последовательного процессинга и записи?

Exactly-once процессинг ИМХО это миф

источник

21:36пожаловаться #3

AS

Andrey Shevchenko in Архитектура данных

не будет ли приколов в виде deadlock’ов при распределенном процессинге в spark, все ноды которого сливают в одну mysql табличку?

Вообще по опыту лучше так не делать

источник

21:36пожаловаться #4

DT

Denis Troyan in Архитектура данных

Andrey Shevchenko

Вообще по опыту лучше так не делать

а как лучше делать?

источник

21:37пожаловаться #5

AS

Andrey Shevchenko in Архитектура данных

Хотя на такой низкой частоте проблем быть особо не должно

источник

21:37пожаловаться #6

AS

Andrey Shevchenko in Архитектура данных

а как лучше делать?

Писать в in-memory хранилище типо Redis

источник

21:38пожаловаться #7

DT

Denis Troyan in Архитектура данных

Andrey Shevchenko

Писать в in-memory хранилище типо Redis

а его с mysql синхронизировать?

источник

21:38пожаловаться #8

AS

Andrey Shevchenko in Архитектура данных

Да, в нужную под запросы структуру

источник

21:38пожаловаться #9

DT

Denis Troyan in Архитектура данных

Andrey Shevchenko

Да, в нужную под запросы структуру

а чем из redis в mysql лить?

источник

21:39пожаловаться #10

AS

Andrey Shevchenko in Архитектура данных

Это такая speed ветка lambda архитектуры получается

источник

21:39пожаловаться #11

DT

Denis Troyan in Архитектура данных

хочется снизить время появления данных в mysql. Интуиция подсказывает, что kafka -> spark -> redis -> ? -> Mysql будет медленнее kafka -> spark -> mysql

источник

21:40пожаловаться #12

DT

Denis Troyan in Архитектура данных

(и больше зоопарк => точек отказа)

источник

21:43пожаловаться #13

AS

Andrey Shevchenko in Архитектура данных

Можно лить сразу, но вроде помнится ловили неконсистентность

источник

21:44пожаловаться #14

DT

Denis Troyan in Архитектура данных

Andrey Shevchenko

Можно лить сразу, но вроде помнится ловили неконсистентность

из-за параллельного писания спарком?

источник

21:44пожаловаться #15

AS

Andrey Shevchenko in Архитектура данных

Да, надо внимательно за партиционированием в ссмом spark следить

источник

21:45пожаловаться #16

AS

Andrey Shevchenko in Архитектура данных

Вообще, in general подход вполне рабочий

источник

21:46пожаловаться #17

AS

Andrey Shevchenko in Архитектура данных

Вместо spark streaming под эту задачу посмотрите еще flink

источник

21:46пожаловаться #18

DT

Denis Troyan in Архитектура данных

ну, в моем случае неконсистентость на короткий промежуток времени - не беда. Данные доедут - станет все хорошо

источник

21:46пожаловаться #19

AS

Andrey Shevchenko in Архитектура данных

ну, в моем случае неконсистентость на короткий промежуток времени - не беда. Данные доедут - станет все хорошо

Ок, посмотрите еще в сторону Flink

источник

21:47пожаловаться #20

1
«
…
‹
15
16
17
18
19
20
21
›
…
»