Size: a a a

2019 June 17

DZ

Dmitry Zuev in Data Engineers
KrivdaTheTriewe
Конекшон можно и пробросить
это ты про что?
источник

K

KrivdaTheTriewe in Data Engineers
Dmitry Zuev
это ты про что?
Ну у эирфлоу есть коннекшоны, которые ты хранишь в базе эирфлоу
источник

DZ

Dmitry Zuev in Data Engineers
есть
источник

GG

George Gaál in Data Engineers
KrivdaTheTriewe
Пришли к тому , что вообще все запускает докероператор и внутри докер оператора все работает
молодцы! я за это и топлю
источник

K

KrivdaTheTriewe in Data Engineers
И операторам передаёшь , можно условно написать sql скрипт и запускать из докера , но параметры соединения то передать нужно как то ?
источник

DZ

Dmitry Zuev in Data Engineers
да, я понял.
источник

RS

Ruben Stefanus in Data Engineers
Есть ли у кого-нибудь электронная книга об Apache Flink, а связанные ресурсы Flink потребляют данные от Kafka? Можно ли поделиться? Спасибо
источник

K

KrivdaTheTriewe in Data Engineers
можно например куипить)
источник

K

KrivdaTheTriewe in Data Engineers
или на сафари букс по триалу почитать
источник

VS

Valeriy Shinkevich in Data Engineers
можно на торрентах поискать, выбор не большой https://data-flair.training/blogs/apache-flink-books/
источник

N

Nata in Data Engineers
Можно ламерский вопрос? Есть текущий HDFS c repl factor 2, есть теоретический GFS, в который теоретически нужно съехать. В доке есть фраза: GFS replicas: The GFS has two replicas: Primary and secondary replicas. Это всмысле у него по дефолту repl factor 2?
источник

ЕГ

Евгений Глотов in Data Engineers
По описанию больше похоже на то, что там оригинал и две реплики разного приоритета
источник

N

Nata in Data Engineers
оу, то есть это x3 места? а кто с ни работает, как-то можно это изменить? допустим, исходный HDFS 50TB, HDFS c replfactor 2 - 100TB, на GFS выйдет 150?
источник

ЕГ

Евгений Глотов in Data Engineers
Да там наверняка тоже можно задать 2
источник

ЕГ

Евгений Глотов in Data Engineers
В хадупе же тоже по умолчанию 3, но можно поменять как в целом, так и для каждой папки отдельно
источник

EL

Evgeny Linnik in Data Engineers
Евгений Глотов
Да там наверняка тоже можно задать 2
Ага, но будь готов к потери части данных, или решай вопрос с возможным вылетом харда на уровне железа (рейд). Если поднимаешь HDFS в облаке, то можно смело ставить 2 и не так смело даже 1 :)
источник

ЕГ

Евгений Глотов in Data Engineers
Evgeny Linnik
Ага, но будь готов к потери части данных, или решай вопрос с возможным вылетом харда на уровне железа (рейд). Если поднимаешь HDFS в облаке, то можно смело ставить 2 и не так смело даже 1 :)
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Evgeny Linnik
Ага, но будь готов к потери части данных, или решай вопрос с возможным вылетом харда на уровне железа (рейд). Если поднимаешь HDFS в облаке, то можно смело ставить 2 и не так смело даже 1 :)
Рейд для хдфс? 😳
источник

EL

Evgeny Linnik in Data Engineers
Vladislav 👻 Shishkov
Рейд для хдфс? 😳
Дааа. Ты удивишься :)
источник

VS

Vladislav 👻 Shishkov in Data Engineers
Зачем?
источник