Size: a a a

2020 January 15

DZ

Dmitry Zuev in Data Engineers
источник
2020 January 16

EP

Easycore Programming in Data Engineers
Ребят, а может кто посоветовать книжку/статью по улучшению перформанса спарка?
источник

AC

Alexander Chermenin in Data Engineers
источник

P

Pavel in Data Engineers
всем привет. расскажите у кого какой опыт был по конфигурации кластера кафки? интересует во чё: зк и брокеры на 1 тачке или на разных? просто кто как делал и были ли грабли)
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
всем привет. расскажите у кого какой опыт был по конфигурации кластера кафки? интересует во чё: зк и брокеры на 1 тачке или на разных? просто кто как делал и были ли грабли)
бареметал или виртуалки?
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
бареметал или виртуалки?
vps
источник

AZ

Anton Zadorozhniy in Data Engineers
кмк проще разделить тогда, разницы никакой, а гибкости больше
источник

AZ

Anton Zadorozhniy in Data Engineers
учтите что ЗК упирается в диски, так что поставьте ему  что-то маленькое но быстрое
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
учтите что ЗК упирается в диски, так что поставьте ему  что-то маленькое но быстрое
дак какфка тоже)
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
дак какфка тоже)
кафка масштабируется, а ЗК нет)
источник

AZ

Anton Zadorozhniy in Data Engineers
если будете делать на одних машинах - делайте директорию ЗК на другом томе, отдельном от данных кафки
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
если будете делать на одних машинах - делайте директорию ЗК на другом томе, отдельном от данных кафки
во, кстати, это проверю)
источник

P

Pavel in Data Engineers
вспомнил) vps + docker
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
вспомнил) vps + docker
докер в смысле кубер?
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
докер в смысле кубер?
не, на впс стоит докер, зк и кафка запускаются как докер контейнеры
источник

AZ

Anton Zadorozhniy in Data Engineers
интересно зачем такое..  в любом случае по канону в докере один процесс - один контейнер, а по волюмам разведите их на разные PV и все
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
интересно зачем такое..  в любом случае по канону в докере один процесс - один контейнер, а по волюмам разведите их на разные PV и все
PV это больше из кубового мира же
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
PV это больше из кубового мира же
ну я имею в виду на разные тома на ваших  этих виртуалках
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
ну я имею в виду на разные тома на ваших  этих виртуалках
да, эт понял. только интересно будет ли профит от разных томов, если к ним будут ходить 2 контейнера, запущенные на 1 докере
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
да, эт понял. только интересно будет ли профит от разных томов, если к ним будут ходить 2 контейнера, запущенные на 1 докере
я не уверен что понимаю что такое два контейнера на одном докере, но мой опыт (и рекомендации, например, конфлюент) показывает что ЗК нужны отдельные и быстрые диски https://docs.confluent.io/current/zookeeper/deployment.html#hardware
источник