Size: a a a

2020 January 16

P

Pavel in Data Engineers
Anton Zadorozhniy
я не уверен что понимаю что такое два контейнера на одном докере, но мой опыт (и рекомендации, например, конфлюент) показывает что ЗК нужны отдельные и быстрые диски https://docs.confluent.io/current/zookeeper/deployment.html#hardware
да, чет я переборщил) просто на впс крутятся 2 контейнера на голом докере (без куба и пр. херни для оркестрации)
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
да, чет я переборщил) просто на впс крутятся 2 контейнера на голом докере (без куба и пр. херни для оркестрации)
это вот не  очень понятно зачем, чтобы с сетью было нескучно работать?
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
это вот не  очень понятно зачем, чтобы с сетью было нескучно работать?
из коробки с сетью особых проблем нет (пока у нас rps < 1000), все друг друга прекрасно видят. это быстро, просто, удобно, рестарт любого сервиса 1 строкой, конфиг тоже в 1 файле (докер компоуз)
источник

AZ

Anton Zadorozhniy in Data Engineers
Pavel
из коробки с сетью особых проблем нет (пока у нас rps < 1000), все друг друга прекрасно видят. это быстро, просто, удобно, рестарт любого сервиса 1 строкой, конфиг тоже в 1 файле (докер компоуз)
интересные доводы, спасибо)
источник

V

Vλadimir in Data Engineers
Привет. запускаю кверю в хайв и получаю ошибку
Error: Error while compiling statement: FAILED: SemanticException [Error 10293]: Unable to create temp file for insert values AlreadyExistsException(message:Table Values__Tmp__Table__1 already exists.)


в самой квери нет создания временных таблиц, нагуглил что они могут создаваться при джоинах (в одной транзакции несколько селект запросов с джоинами) - как решить проблему?
источник

P

Pavel in Data Engineers
Anton Zadorozhniy
интересные доводы, спасибо)
да) сегодня доводы в пользу снятия нагрузки с devops очень канают) по этой причине мы, слава богу, пока отказались от хдфс в пользу готового с3
источник

A

Alexander in Data Engineers
Коллеги,  а есть здесь знатоки oozie? Скажите, можно ли триггерить воркфлоу по будням датасетом, а в выходные просто по времени
источник

T

T in Data Engineers
Alexander
Коллеги,  а есть здесь знатоки oozie? Скажите, можно ли триггерить воркфлоу по будням датасетом, а в выходные просто по времени
первое что приходит на ум 2 разных координатора которые будут использовать один и тотже wf, но я не настоящий сварщик. Но вроде там можно писать if условия
источник

A

Alexander in Data Engineers
T
первое что приходит на ум 2 разных координатора которые будут использовать один и тотже wf, но я не настоящий сварщик. Но вроде там можно писать if условия
О! Надо попробовать
источник

СХ

Старый Хрыч in Data Engineers
https://habr.com/ru/company/sberbank/blog/484096/#comment_21141416 сбер решил людей убить смехом
источник

DM

David Manukian in Data Engineers
@usualreptiloid пробовал с таблицами хайва перезаписать (overwrite) только 1 партицию выставив spark.sql.sources.partitionOverwriteMode= dynamic - не работает,  не делай так если используешься спарк ниже 2.3)
источник

ME

Max Efremov in Data Engineers
хм, а DynamoDB никто не пользуется, разве? В графике популярности её нету(
источник

АЖ

Андрей Жуков in Data Engineers
Max Efremov
хм, а DynamoDB никто не пользуется, разве? В графике популярности её нету(
multi-model ибо
источник

АЖ

Андрей Жуков in Data Engineers
а сбер не подумал
источник

СХ

Старый Хрыч in Data Engineers
Max Efremov
хм, а DynamoDB никто не пользуется, разве? В графике популярности её нету(
ну она менее популярна, она очень дорогая, я клиента недавно с неё переносил. 10к баксов в месяц превратились в scylladb rf5 и 1200 баксов на железо, нагрузка на железе 15%
источник

AE

Alexey Evdokimov in Data Engineers
динаму юзать всё равно что топить паровоз пачками ассигнаций
источник

АЖ

Андрей Жуков in Data Engineers
Старый Хрыч
ну она менее популярна, она очень дорогая, я клиента недавно с неё переносил. 10к баксов в месяц превратились в scylladb rf5 и 1200 баксов на железо, нагрузка на железе 15%
источник

СХ

Старый Хрыч in Data Engineers
ну возможно, но мы людей уже перводили
источник

AE

Alexey Evdokimov in Data Engineers
для чего-нибуть особо мишн критикал пойдёт, а так дорого очень
источник

СХ

Старый Хрыч in Data Engineers
oracle популярнее mysql О_О
источник