Size: a a a

2020 October 11

IS

Igor Sam in Data Engineers
Anton Zadorozhniy
Вот так и победим пиратство, one community at a time
👍
источник
2020 October 12

AA

Artem Arzhanov in Data Engineers
Алексей
set hive.tez.java.opts - в hive
или ps -eo pid,user,pcpu,cmd --sort -pcpu | grep application_1564490628193_26776 | head - cmd процесса
Спасибо.
Именно про этот параметр хайва я и говорил. Но он не пустой. И если пользователь через него просто размер хипа передаст, то потеряются другие опции (хотя, там в основном про GC)
источник

AA

Artem Arzhanov in Data Engineers
Pavel
Тез это ж чай
Тез это туроператор жи
источник

P

Pavel in Data Engineers
Artem Arzhanov
Тез это туроператор жи
И да)
источник

P

Pavel in Data Engineers
Artem Arzhanov
Тез это туроператор жи
Он только вроде тез тур
источник

А

Алексей in Data Engineers
Artem Arzhanov
Спасибо.
Именно про этот параметр хайва я и говорил. Но он не пустой. И если пользователь через него просто размер хипа передаст, то потеряются другие опции (хотя, там в основном про GC)
да, неправильно его перетирать
источник

А

Алексей in Data Engineers
Artem Arzhanov
Спасибо.
Именно про этот параметр хайва я и говорил. Но он не пустой. И если пользователь через него просто размер хипа передаст, то потеряются другие опции (хотя, там в основном про GC)
размер хипа для воркеров  tez-hive + yarn передается же параметром:
--hiveconf hive.tez.container.size=8000
источник

AA

Artem Arzhanov in Data Engineers
Вот не уверен, что это то, что нужно. Но спасибо, проверю.
Текущие параметры хайва хотя бы видно сразу в cli
источник

А

Алексей in Data Engineers
через hive.tez.java.opts не все, кста, параметры можно поменять. К примеру тип GC  там не поменять
источник

SD

Serg D. in Data Engineers
Всем привет. Друзья, возник такой вопрос: в Oozie есть spark2 action и есть возможность запускать spark-submit через shell. Админы хадупа без объяснения настаивают на запуске через shell. Может кто пояснить в чем преимущество? Я пока что только вижу что для запуска через shell требуется два контейнера: один непосредственно на shell, второй на spark.
источник

A

Alex in Data Engineers
не могу сказать про 5й узи, но до 4го включительно у узи всегда 2 контейнера
источник

A

Alex in Data Engineers
1 апп мастер для MR джобы
1 сам экшен (map task в логах)
источник

A

Alex in Data Engineers
запрос на запуск через шел достаточно странный
особенно в контекте что в этом случае будет всегда использоваться системный спарк для сабмита
в случае екшена если правильно сформировать класспас можно любую версию использовать (узи сразу проведет локализацию, а потом запустит этот java action, у нас по крайней мере так сделано)
источник

SD

Serg D. in Data Engineers
Спасибо, стало чуть понятнее
источник

A

Alex in Data Engineers
2 контейнера это легаси от ещё старой мэп редьюс архитектуры самого хадупа
в 5м вроде как сделали уже нормально
источник

ME

Max Efremov in Data Engineers
А у ливи есть какие-то ограничения на число одновременных интерактивных сессий? У меня тут 15 задач запускается и чот ливи падает на этом...
источник

ME

Max Efremov in Data Engineers
Да, есть такое, при дефолтном конфиге возможно только 10 сессий одновременных: https://issues.apache.org/jira/browse/LIVY-745
источник

AX

Alex Xela in Data Engineers
Я не бот но не читал 😛
источник

AA

Artem Arzhanov in Data Engineers
Алексей
размер хипа для воркеров  tez-hive + yarn передается же параметром:
--hiveconf hive.tez.container.size=8000
Что-то неоднозначный этот параметр какой-то...
источник

А

Алексей in Data Engineers
Artem Arzhanov
Что-то неоднозначный этот параметр какой-то...
чем неоднозначный?
источник