Дата инженеры! Часть1. Как понять сколько надо phoenix query server (PQS) на кластере? Влияет на это количество воркеров в джобах? Или их нужно ставить только там, где есть Region Server HBase ?
Часть 2. Как понять в чем затык при работе с феникс. Сейчас по 87млн записей, чтение + лимит + шоу занимает около 10м. Как-то долговато....
Cап чатик. вопрос по работе с вложенными структурами в спарке (Scala / SQL). Что хочется сделать - применить функцию к полю в глубине вложенной структуры, не меняя самой структуры. Скажем у меня есть поле transactions, внутри него массив со словарями, и вот к одному из параметров у элементов этого массива я хочу применить функцию (скажем, возведение в квадрат). Как такое делается?