Господа, посоветуйте пожалуйста. Если правильно понимаю, до версии 2.4 Спарк при запуске запроса через hive context запускал mr jobs. Однако в новых версиях спарка он запускает hive запрос через свои задачи. Вопрос: можно ли это исправить? Я хочу запускать sql запросы именно на Хайве.
Всем привет. Направьте, пож-та. Стоит задача по сбору кликстрима (~10к events/min). Я так понимаю, что есть три пути: snowplow, divolte, самопис. Что выбрать?
Выбираете, что бы такого посмотреть вечером? Мы предлагаем свой вариант — доклады SmartData 2020. Плейлист открыт, его можно сохранять, шарить, смотреть и пересматривать.