Size: a a a

ClickHouse не тормозит

2019 November 24

A

Alex in ClickHouse не тормозит
1 - спасибо, попробую
2 - большая часть запросов к этой таблице учитывают как раз те колонки, которые в ORDER BY, но в целом - какие порекомендовали бы выбросить или поменять местами?
источник

ДБ

Дмитрий Бережнов... in ClickHouse не тормозит
Alex
1 - спасибо, попробую
2 - большая часть запросов к этой таблице учитывают как раз те колонки, которые в ORDER BY, но в целом - какие порекомендовали бы выбросить или поменять местами?
Если прям все надо и основные запросы прям ложатся на такое - пусть будет. И да, возможно сортировка до КХ не поможет, если вы вставляете из спарка в КХ в несколько потоков
источник

A

Alex in ClickHouse не тормозит
отсортируем каждый поток, вдруг поможет 🙂 крутились вокруг того, чтобы запись сделать как можно быстрее, используя все вычислительные ресурсы кластера
источник

ДБ

Дмитрий Бережнов... in ClickHouse не тормозит
Alex
отсортируем каждый поток, вдруг поможет 🙂 крутились вокруг того, чтобы запись сделать как можно быстрее, используя все вычислительные ресурсы кластера
Так и нужно, просто не стоит вставлять в разнобой партиций в одну таблицу
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Всем привет, вопрос про партиционирование в ch, помню что видел где то рекомендацию не создавать больше 10к партиций на сервер. Вопрос, с чем это связано?
источник

I

Ilya K. in ClickHouse не тормозит
Clickhouse  создает 2 файла на каждую партицию в колонке. 10к партиций это минимум 20к * кол-во столбцов файлов на файловой системе
источник

A

Andrey in ClickHouse не тормозит
Dmitriy Govorukhin
Всем привет, вопрос про партиционирование в ch, помню что видел где то рекомендацию не создавать больше 10к партиций на сервер. Вопрос, с чем это связано?
Каждая партиция это каталог с файлами. Диск заерзаете
источник

А

А in ClickHouse не тормозит
Dmitriy Govorukhin
Всем привет, вопрос про партиционирование в ch, помню что видел где то рекомендацию не создавать больше 10к партиций на сервер. Вопрос, с чем это связано?
С тем что каждая партиция отдельный файл и чтобы их читать нужно дофига ресурсов. Попробуйте открыть в проводника папку с таким количеством файлов и еще из нескольких из них начать читать параллельно
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Да я это понимаю)
1. Могу поставить ssd, он хорошо умеет читать параллельно.
2. Могу увеличить количество дисков, и размазать партиции по ним, тем самым увеличить максимальное число партиции народу
3. Могу поставить RAID
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Все верно?
источник

I

Ilya K. in ClickHouse не тормозит
у меня сейчас по 300к партов на серверах, вроде проблем нет
источник

A

Andrey in ClickHouse не тормозит
Ilya K.
у меня сейчас по 300к партов на серверах, вроде проблем нет
партов или партиций?
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Какой размер партиции в среднем?
источник

I

Ilya K. in ClickHouse не тормозит
партов
источник

А

А in ClickHouse не тормозит
Откуда так много?
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Dmitriy Govorukhin
Да я это понимаю)
1. Могу поставить ssd, он хорошо умеет читать параллельно.
2. Могу увеличить количество дисков, и размазать партиции по ним, тем самым увеличить максимальное число партиции народу
3. Могу поставить RAID
В моих рассуждениях есть ошибка? Рекомендация про 10к имеет отношение к 1 hdd?
источник

IE

Ivan EKbfh in ClickHouse не тормозит
Привет!
А тут кто-то пользует кх с кафкой?
Вопрос:
Вы зукипер для КХ разделяете от зукипера для кафки или зависит от нагрузки?
источник

I

Ilya K. in ClickHouse не тормозит
Dmitriy Govorukhin
Какой размер партиции в среднем?
SELECT formatReadableSize(sum(bytes_on_disk) / count())
FROM system.parts

┌─formatReadableSize(divide(sum(bytes_on_disk), count()))─┐
│ 471.10 KiB                                              │
└─────────────────────────────────────────────────────────┘
источник

I

Ilya K. in ClickHouse не тормозит
Ivan EKbfh
Привет!
А тут кто-то пользует кх с кафкой?
Вопрос:
Вы зукипер для КХ разделяете от зукипера для кафки или зависит от нагрузки?
зависит от нагрузки, но рекомендуют разделять
источник

DG

Dmitriy Govorukhin in ClickHouse не тормозит
Ilya K.
SELECT formatReadableSize(sum(bytes_on_disk) / count())
FROM system.parts

┌─formatReadableSize(divide(sum(bytes_on_disk), count()))─┐
│ 471.10 KiB                                              │
└─────────────────────────────────────────────────────────┘
Супер маленькие, у меня будут по несколько GB
источник