Телеграмм чат группы qlikbi

Держите.
Основная идея:
Генерируете недостающие даты для каждого клиента.
Ставите флаг, если заявка есть, то 1, нет 0. И делаете RangeSum по 6 предыдущим месяцам

источник

13:10пожаловаться #4

АВ

Анатолий Ветринцев... in Qlik BI chat

Спасибо! это тестовый пример, боевой содержит 2 таблицы фактов по 35 и 28 млн записей, это еще + 350 млн недостающих дат, чтобы каждый клиент получил свои наборы за 12 месяцев. Не подходит для действующей модели :(

источник

13:36пожаловаться #5

DS

Daniil Semenov in Qlik BI chat

ну, можно сделать и на текущих данных.
Генерация пустых нужна, чтобы, допустим смотря на месяц в котором заявок не было, он бы увидел там 0 или количество за прошлые 6.

источник

13:40пожаловаться #6

GE

Galina E in Qlik BI chat

Анатолий Ветринцев

Спасибо! это тестовый пример, боевой содержит 2 таблицы фактов по 35 и 28 млн записей, это еще + 350 млн недостающих дат, чтобы каждый клиент получил свои наборы за 12 месяцев. Не подходит для действующей модели :(

У вас даты должны повторятся, а флаг много место не займёт, так что объем приложения не должен увеличится. А формула будет простая и считаться должна быстро.

источник

15:07пожаловаться #7

АВ

Анатолий Ветринцев... in Qlik BI chat

Galina E

У вас даты должны повторятся, а флаг много место не займёт, так что объем приложения не должен увеличится. А формула будет простая и считаться должна быстро.

Попробую

источник

15:41пожаловаться #8

OT

Oleg Troyansky in Qlik BI chat

Sergey Nazarkin

Пробовал схему предложенную выше:
"Zayav:
NoConcatenate LOAD
USERID,
DATE,
IDZAYAV,
Autonumber(recno(), USERID) as ZayvNo
Resident Zayav_temp
WHERE Autonumber(recno(), USERID) <=1
Order by USERID,DATE desc;
drop table Zayav_temp;"
На поверку оказалось ещё медленнее чем group by.

Да, не удивлюсь... Можно и ещё проще, без Autonumber, с помощью where not exists, это может быть немного быстрее, но сортировка большой таблицы сама по себе тоже медленная.

источник

16:17пожаловаться #9

IG

I G in Qlik BI chat

https://www.youtube.com/watch?v=risl1RTplzw

YouTube

The Ministry Of Silly Charts

A fun video about silly charts like sausage, saw, stairs, shark, flower, dice and highway charts. Dont take it too serious! Download the app here https://git...

источник

21:23пожаловаться #10

СК

Сергей Кравченко... in Qlik BI chat

I G

https://www.youtube.com/watch?v=risl1RTplzw

YouTube

The Ministry Of Silly Charts

A fun video about silly charts like sausage, saw, stairs, shark, flower, dice and highway charts. Dont take it too serious! Download the app here https://git...

sticker.webp

(35.37 Кб)

источник

21:37пожаловаться #11

СК

Сергей Кравченко... in Qlik BI chat

Круто))

источник

21:37пожаловаться #12

АВ

Анатолий Ветринцев... in Qlik BI chat

слушайте, а что будет быстрее? у меня есть большая таблица со столбцом, по которому я считаю уникальные значения, там всего 10% повторений на 100% записей. Высокая кардинальность в общем. и вот. быстрее посчитать Count(distinct Field) или создать связанную таблицу по этому полю, добавить туда флаг с 1 и потом брать по нему Sum(Field_ind). Как быстрее будет?

источник

23:27пожаловаться #13

YL

Yury Lapickiy in Qlik BI chat

У меня на 180 млн строк и 80 тыс уникальных distinct работает очень быстро

источник

23:51пожаловаться #14

АВ

Анатолий Ветринцев... in Qlik BI chat

Daniil Semenov

Держите.
Основная идея:
Генерируете недостающие даты для каждого клиента.
Ставите флаг, если заявка есть, то 1, нет 0. И делаете RangeSum по 6 предыдущим месяцам

Вот изучаю пример. в измерениях по столбцу вместо количества повторов вижу номер абонента. А надо сколько попыток было и посчитать количество абонентов, которые обращались повторно указанное количестов раз. +RangeSum с After работает только если в таблицу прогружены все месяцы, а если выберу три последних, то он вернет некорректные данные (относительно изначального запроса). Есть другие варианты?

источник

23:52пожаловаться #15

АВ

Анатолий Ветринцев... in Qlik BI chat

+ задвоить все строки не получится, там есть праметры, которые я суммирую в других мерах, и это приведет к искажениям других метрик.

источник

23:53пожаловаться #16

АВ

Анатолий Ветринцев... in Qlik BI chat

я вот думаю по другому сделать. Создать отдельную таблицу, в которой будет ID абонента и дата приземления (сделаю не по дням, а по месяцам, мне детальнее пока не надо) и там на каждого абонента будет 3 поля: ID абонента, Прошло месяцев с даты обращения, дата учета повторного обращения. в горзинте пол года, на каждую запись будет 6 записей:
для инцидента ID=1, [Дата обращения]=15.06.2019 получим 6 записей:
ID абонента|Сдвиг месяцев|Период учета
1|0|01.06.2019
1|1|01.07.2019
1|2|01.08.2019
1|3|01.09.2019
1|4|01.10.2019
1|5|01.11.2019

И потом по полю период учета я смогу считать сколько на каждого абонента приходится повторов через Value List

Это рабочая схема?

источник

23:56пожаловаться #17

2019 November 30

ЕС

Евгений Стучалкин... in Qlik BI chat

Коллеги, подскажите. Будет ли мера sum({<Field1=a, Field2=b>} Field3) принципиально отличаться по производительности от sum({<Field1=a>}*{<Field2=b>} Field3)?

источник

11:51пожаловаться #18

OT

Oleg Troyansky in Qlik BI chat

Евгений Стучалкин

Коллеги, подскажите. Будет ли мера sum({<Field1=a, Field2=b>} Field3) принципиально отличаться по производительности от sum({<Field1=a>}*{<Field2=b>} Field3)?

Принципиально разницы не должно быть, то есть ответ должен быть тот же. Но технически, первое условие затрагивает только 2 поля, по которым прописаны условия, а второе условие касается всех полей в базе данных. То есть, я не удивлюсь если на больших данных второе условие будет считаться несколько медленнее и потребует чуть больше памяти для хранения.

источник

16:12пожаловаться #19

ZS

Zhenya Skrebanov in Qlik BI chat

Oleg Troyansky

Принципиально разницы не должно быть, то есть ответ должен быть тот же. Но технически, первое условие затрагивает только 2 поля, по которым прописаны условия, а второе условие касается всех полей в базе данных. То есть, я не удивлюсь если на больших данных второе условие будет считаться несколько медленнее и потребует чуть больше памяти для хранения.

Вот этот пост Джона Визерспуна может немного добавить идей, о том, как оно считается, https://community.qlik.com/t5/QlikView-Creating-Analytics/Performance-Set-Analysis-vs-IF-vs-Multiplication/td-p/146655 а именно речь идёт о сравнении IF, умножения и сет анализа с точки зрения скорости расчёта на том же дата сете.

Qlik

Performance: Set Analysis vs. IF vs. Multiplication

One of the articles in the Wiki is "Using Flags to avoid IF formulas". The advice certainly seems straightforward and correct on the surface. Yes, doing an IF with a flag should be faster than a more complicated conditional. Yes, it makes sense to have a flag with values 1 and null() to avoid distor...

источник

16:41пожаловаться #20