Size: a a a

ClickHouse не тормозит

2019 November 22

DC

Dmitry Che in ClickHouse не тормозит
в смысле arrayElement(arraySort(x), 0)
источник

AS

Aleh Sauko in ClickHouse не тормозит
я через arrayFirst
источник

AS

Aleh Sauko in ClickHouse не тормозит
Dmitry Che
в смысле arrayElement(arraySort(x), 0)
так по индексу упасть могет
источник

AS

Aleh Sauko in ClickHouse не тормозит
но должно ж быть лучше, сортировать избыточно думаю
источник

DC

Dmitry Che in ClickHouse не тормозит
ох, не знал про arrayFirst, да, конечно это избыточно
источник

AV

Anton Vershinin in ClickHouse не тормозит
arrayReduce(‘min’, array)
источник

AS

Aleh Sauko in ClickHouse не тормозит
Anton Vershinin
arrayReduce(‘min’, array)
спс)
источник

V

Vadim in ClickHouse не тормозит
Как сделать такого рода запрос? Получить количество, где условное поле phone является единичным в БД?
источник

A

Andrey in ClickHouse не тормозит
Vadim
Как сделать такого рода запрос? Получить количество, где условное поле phone является единичным в БД?
Количество чего? Что значит единичное поле в бд?
источник

V

Vadim in ClickHouse не тормозит
Andrey
Количество чего? Что значит единичное поле в бд?
Количество единичных полей в БД, которые встречаются только раз
источник

A

Andrey in ClickHouse не тормозит
Vadim
Количество единичных полей в БД, которые встречаются только раз
system.columns посмотрите
источник

G

GithubReleases in ClickHouse не тормозит
yandex/ClickHouse tagged: v19.17.4.11-stable
Link: https://github.com/ClickHouse/ClickHouse/releases/tag/v19.17.4.11-stable
Release notes:
v19.17.4.11-stable
источник

VD

Vahram Darbinyan in ClickHouse не тормозит
Добрый день, коллеги! У меня КХ в докере не читает данные из config.xml и не обновляет config-preprocessed.xml.

Docker run у меня такой.
՝՝՝
docker run -d \
--name clickhouse-server-19.17 \
--ulimit nofile=262144:262144 \
--user 110:115 \
-v /etc/clickhouse-server:/etc/clickhouse-server \
-v /var/lib/clickhouse:/var/lib/clickhouse \
-v /var/log/clickhouse-server:/var/log/clickhouse-server \
-p 10.81.204.90:8123:8123 \
-p 10.81.204.90:9000:9000 \
-p 10.81.204.90:9009:9009 \
yandex/clickhouse-server:latest
՝՝՝
Не подскажите, я что-то упускаю?
источник

at

alexey tihonov in ClickHouse не тормозит
Приветсвую. Обнаруженно странное поведение при применении аггрегатных функций к массивам с Nullable элементами.

CREATE TABLE testNested_local(
   Id Int32,
   Objects Nested
   (
       Id Int32,
       Foo Nullable(Int32)
   ),
   Arr Array(Nullable(Int32))
)ENGINE = MergeTree()
ORDER BY Id

CREATE TABLE testNested AS testNested_local
ENGINE = Distributed(cluster, database, testNested_local, Id)

INSERT INTO testNested SELECT number, [-number], [null], [null] FROM numbers(10)

SELECT * FROM testNested
FORMAT JSONEachRow

{"Id":0,"Objects.Id":[0],"Objects.Foo":[null],"Arr":[null]}
{"Id":1,"Objects.Id":[-1],"Objects.Foo":[null],"Arr":[null]}
{"Id":2,"Objects.Id":[-2],"Objects.Foo":[null],"Arr":[null]}
{"Id":3,"Objects.Id":[-3],"Objects.Foo":[null],"Arr":[null]}
{"Id":4,"Objects.Id":[-4],"Objects.Foo":[null],"Arr":[null]}
{"Id":5,"Objects.Id":[-5],"Objects.Foo":[null],"Arr":[null]}
{"Id":6,"Objects.Id":[-6],"Objects.Foo":[null],"Arr":[null]}
{"Id":7,"Objects.Id":[-7],"Objects.Foo":[null],"Arr":[null]}
{"Id":8,"Objects.Id":[-8],"Objects.Foo":[null],"Arr":[null]}
{"Id":9,"Objects.Id":[-9],"Objects.Foo":[null],"Arr":[null]}

Запросы к Distributed таблице.

SELECT
   any(Objects.Foo),
   has(any(Objects.Foo), 1),
   uniqArray(Objects.Foo)
FROM testNested
FORMAT JSONEachRow

{
 "any(Objects.Foo)": [1],
 "has(any(Objects.Foo), 1)": 1,
 "uniqArray(Objects.Foo)": null
}

При вызове Any к Nullable полю Nested структуры появляется элемент 1, хотя его там не должно быть.

SELECT
   any(Objects.Foo),
   has(any(Objects.Foo), 0),
   
   any(Arr),
   has(any(Arr), 1),
   
   uniqArray(Objects.Foo),
   uniqArray(Arr)
FROM testNested
FORMAT JSONEachRow

{
 "any(Objects.Foo)": [0],
 "has(any(Objects.Foo), 0)": 1,

 "any(Arr)": [1],
 "has(any(Arr), 1)": 1,

 "uniqArray(Objects.Foo)": null,
 "uniqArray(Arr)": null
}

С массивом такая же картина. Только у поля Nested структуры теперь 0.

Запросы к локальным таблицам.

SELECT
   any(Objects.Foo),
   has(any(Objects.Foo), 1),
   uniqArray(Objects.Foo)
FROM testNested_local
FORMAT JSONEachRow

{
 "any(Objects.Foo)": [],
 "has(any(Objects.Foo), 1)": 0,
 "uniqArray(Objects.Foo)": null
}

SELECT
   any(Objects.Foo),
   has(any(Objects.Foo), 0),
   
   any(Arr),
   has(any(Arr), 1),
   
   uniqArray(Objects.Foo),
   uniqArray(Arr)
FROM testNested_local
FORMAT JSONEachRow

{
 "any(Objects.Foo)": [],
 "has(any(Objects.Foo), 0)": 0,

 "any(Arr)": [],
 "has(any(Arr), 1)": 0,

 "uniqArray(Objects.Foo)": null,
 "uniqArray(Arr)": null
}

Any возвращает пустые массивы, хотя их нет таблице.

ClickHouse 19.9.5.36
источник

AM

Anton Mikhalev in ClickHouse не тормозит
Народ здарова! Есть такая таблица:
        CREATE TABLE IF NOT EXISTS item_labels (
           item_id UInt64,
           country_code FixedString(2),
           label_code UInt16,
           flag Int8,
           updated_at DateTime
       )
       ENGINE = SummingMergeTree(flag)
       PARTITION BY toYYYYMM(updated_at)
       ORDER BY (
           item_id,
           country_code,
           label_code
       )


Вопрос: Почему не работает FINAL ?)
источник

AM

Anton Mikhalev in ClickHouse не тормозит
источник

AM

Anton Mikhalev in ClickHouse не тормозит
пробовали на 19.16 и на 19.4 - результат одинаковый
источник

ДК

Дмитрий Клеймёнов... in ClickHouse не тормозит
Добрый день! Нужна помощь. Есть шардированный кластер из двух нод. Создаю таблицу create table my_table on cluster my_cluster (user_id: Int64, ...) engine = ReplicatedMergeTree(...) ORDER BY user_id ...
следом создаю Distributed-таблицу с sharding_key=user_id
и пишу в Distributed-таблицу. Данные дублируются: select user_id from my_table where user_id=... выдает две записи.
Причем, если вместо ReplicatedMergeTree использовать MergeTree, все нормально.
Версия 19.14.7.15
источник

S

Shazo in ClickHouse не тормозит
Anton Mikhalev
Народ здарова! Есть такая таблица:
        CREATE TABLE IF NOT EXISTS item_labels (
           item_id UInt64,
           country_code FixedString(2),
           label_code UInt16,
           flag Int8,
           updated_at DateTime
       )
       ENGINE = SummingMergeTree(flag)
       PARTITION BY toYYYYMM(updated_at)
       ORDER BY (
           item_id,
           country_code,
           label_code
       )


Вопрос: Почему не работает FINAL ?)
а если set enable_optimize_predicate_expression = 1 и enable_optimize_predicate_expression_to_final_subquery = 1?
источник

S

Shazo in ClickHouse не тормозит
Дмитрий Клеймёнов
Добрый день! Нужна помощь. Есть шардированный кластер из двух нод. Создаю таблицу create table my_table on cluster my_cluster (user_id: Int64, ...) engine = ReplicatedMergeTree(...) ORDER BY user_id ...
следом создаю Distributed-таблицу с sharding_key=user_id
и пишу в Distributed-таблицу. Данные дублируются: select user_id from my_table where user_id=... выдает две записи.
Причем, если вместо ReplicatedMergeTree использовать MergeTree, все нормально.
Версия 19.14.7.15
select * from system.clusters с фильтром по указанному кластеру, что выдает?
источник