Size: a a a

ClickHouse не тормозит

2019 November 27

YK

Yuri Kudryavtsev in ClickHouse не тормозит
из трех
источник

MT

Maks Ti in ClickHouse не тормозит
Потому что нужна Distributed таблица
источник

MT

Maks Ti in ClickHouse не тормозит
Или можно ручками спрашивать у разных таблиц
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
типа накрутить на реплицированную дистрибьютед?
источник

MT

Maks Ti in ClickHouse не тормозит
Ну да
источник

S

Slach in ClickHouse не тормозит
Matwey Kornilov
А этот Павел в этом чате не сидит случайно?
нет.
но по ссылке выше есть профиль linkedin напишите в него
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
я создал таблицу таким вот макаром
CREATE TABLE ontime_replica2 ON CLUSTER clickhouse_cluster
(...)
ENGINE = ReplicatedMergeTree(
   '/clickhouse_cluster/tables/{shard}/ontime_replica',
   '{replica}',
   FlightDate,
   (Year, FlightDate),
   8192);
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
и пытаюсь с нее же селектить, и не работает, получается надо поверх нее создать дистрибьютер, если я правильно понял
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
и пытаюсь с нее же селектить, и не работает, получается надо поверх нее создать дистрибьютер, если я правильно понял
Да, верно
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
Maks Ti
Да, верно
надо ее создавать на каждом сервере же ?
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
надо ее создавать на каждом сервере же ?
Можно создать на том, куда будут идти запросы
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
все равно судя по логам только с одного
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
надо ее создавать на каждом сервере же ?
Нет необходимости создавать ее на каждом сервере
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
все равно судя по логам только с одного
Есть настройки load-balancing и еще prefer local replica (или как то так). Их можно/нужно покрутить
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
load_balancing │ random │       1 │ Which replicas (among healthy replicas) to preferably send a query to (on the first attempt) for distributed processing. │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │        0
источник

MT

Maks Ti in ClickHouse не тормозит
prefer_localhost_replica¶

Enables/disables preferable using the localhost replica when processing distributed queries.

Possible values:

   1 — ClickHouse always sends a query to the localhost replica if it exists.
   0 — ClickHouse uses the balancing strategy specified by the load_balancing setting.

Default value: 1.
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
load_balancing │ random │       1 │ Which replicas (among healthy replicas) to preferably send a query to (on the first attempt) for distributed processing. │ ᴺᵁᴸᴸ │ ᴺᵁᴸᴸ │        0
^
источник

YK

Yuri Kudryavtsev in ClickHouse не тормозит
то есть если я правильно понял то по умолчанию используется параметр брать только с одной реплики локальной
источник

MT

Maks Ti in ClickHouse не тормозит
Yuri Kudryavtsev
то есть если я правильно понял то по умолчанию используется параметр брать только с одной реплики локальной
Да, просто distributed таблица не всегда находится на той же машине, тут в чате был пример, когда была одна "большая" машина, которая могла делать все группировки в памяти, и кластер из "маленьких" на которых были данные.
источник

A

Alexandr in ClickHouse не тормозит
\0/
Задача: в таблице json_test есть колонка с типом String в которой лежат вот такие json массивы
[{"index":10,"value":"none"},{"index":1,"value":"RUS"}]
[{"index":7,"value":"none"},{"index":3,"value":"test"}]

Требуется получить все строки в которых есть элемент с index = 10
Пока ничего умнее ... WHERE position(customDimensions, '"index":10') != 0 не придумалось. Что-то подсказывает, что мне может помочь JSONExtract, но пока не удалось с ним договориться.
Есть идеи как провернуть эту небанальную авантюру?
источник