Size: a a a

2019 July 11

A

Alex in Data Engineers
Это кстати почему и идёт деление по vcpu и врубание cgroups

На cpu уже они работают и сейчас идёт обсуждение по включению их для io
источник

MB

Mikhail Butalin in Data Engineers
вобщем я надеюсь что зарезав количество VCPU на очередь, получится снизить IO
источник

AS

Andrey Smirnov in Data Engineers
Mikhail Butalin
у меня пришлось на IO львиная нагрузка
вангую, hive job зачитывали много с дисков , а потом писали много в hbase
источник

MB

Mikhail Butalin in Data Engineers
хз, я не разобрался до конца.
источник

MB

Mikhail Butalin in Data Engineers
там из Kylin чтото в TEZ прилетело и начался адок
источник

AS

Andrey Smirnov in Data Engineers
Mikhail Butalin
там из Kylin чтото в TEZ прилетело и начался адок
еще хуже, Kylin читал тоже из hbase
источник

MB

Mikhail Butalin in Data Engineers
нуда, яж писл выше...
источник

MB

Mikhail Butalin in Data Engineers
надо както калин запереть в своей группе и не дать ему выжирать 100%
источник

AS

Andrey Smirnov in Data Engineers
Mikhail Butalin
надо както калин запереть в своей группе и не дать ему выжирать 100%
а в чем проблема, заведи для него отдельную очередь
http://kylin.apache.org/docs23/install/advance_settings.html
источник

PA

Polina Azarova in Data Engineers
Alex
И всё становится намного веселей когда ноды несиметричные :) (разные точки монтирования дисков, их разное количество, разные рам и цпу)
это прибивается менеджером конфигурации)
и всё вновь замечательно 🌈
источник

MB

Mikhail Butalin in Data Engineers
прибивается - не правилно
источник

MB

Mikhail Butalin in Data Engineers
или имелось ввиду - фиксируется?
источник

MB

Mikhail Butalin in Data Engineers
Andrey Smirnov
а в чем проблема, заведи для него отдельную очередь
http://kylin.apache.org/docs23/install/advance_settings.html
ага, спасибо
источник

PA

Polina Azarova in Data Engineers
для меня это почти одинаково))
параметризация и параметры к тачке привязаны
источник

PA

Polina Azarova in Data Engineers
также параметры на группы хостов и дефолтные параметры
источник

RB

Ramzan Bekbulatov in Data Engineers
Добрый день! Какие хранилища в проде используют для хранения временных рядов?

Т.е. есть время (таймстемп) и связанное с этим временем значение (джсон). Самые частые запросы это выдать значения за временной интервал, т.е. от одного таймстемпа до другого.

Пока суммарно значений по количеству около миллиарда, ожидается рост до 5-10 млдр. Плюс хочется иметь быструю заливку данных (не критично).
источник

РА

Рамиль Ахмадеев in Data Engineers
привет
источник

A

Alex in Data Engineers
то есть хочется вытянуть миллиард значений на запросе?
источник

РА

Рамиль Ахмадеев in Data Engineers
посмотри в сторону Cassandra или ClickHouse
источник

RB

Ramzan Bekbulatov in Data Engineers
Alex
то есть хочется вытянуть миллиард значений на запросе?
Не, на запросе, в среднем, по 100-10000, не сильно больше
источник