Всем привет! Может ли AWS EMR HBase поддерживать пропускную способность в 12000 записей в секунду, когда средний размер записи 10 КБ, но есть записи до 15 МБ без сжатия? Какая может быть рекомендована конфигурация и вариант хранилища?
Есть проблема может кто подскажет как решить. В ярне зависает app со статусом NEW_SAVING. При этом нет ни логов ни чего, понять почему не получается, есть ли настройка в ярне которая убивала бы аппы если они простаивают больше часа ?
Есть проблема может кто подскажет как решить. В ярне зависает app со статусом NEW_SAVING. При этом нет ни логов ни чего, понять почему не получается, есть ли настройка в ярне которая убивала бы аппы если они простаивают больше часа ?
а не стоит ли у вас лимит запускаемых app для юзера?
Всем привет! Может ли AWS EMR HBase поддерживать пропускную способность в 12000 записей в секунду, когда средний размер записи 10 КБ, но есть записи до 15 МБ без сжатия? Какая может быть рекомендована конфигурация и вариант хранилища?
Надо будет ковыряться с сеткой на кластере. Я глубоко не вникал в этот вопрос. Но на практике заметил, что как будто бы сеть ограничена 1 гигабитом на кластерах с нормальным железом. Например m16.xlarge. А у вас входной поток данных в среднем будет 10кб*12000/1024байта ~117 мегабайт в секунду. Это уже почти предел гигабитной сети. Так что посмотрите про сетки на emr кластере.
Ни разу не слышал чтоб на ebs хранили, но тут как бы ещё вопрос юс кейса. Данные на с3 хранят потому что есть куча инструментов которые могут делать аналитику на этих данных
Читать не часто. На с3 дешевле, чем ec2 с диском. Читается мало, в основном идет запись, удалений тоже практически нет. Еще вопрос поддерживается ли WAL на SSD в EMR?