Size: a a a

2019 December 02

VF

Vladimir Frolov in Qlik BI chat
Анатолий Ветринцев
Всем привет:) Выше запрос. Он отрабатывает 50 минут на 38 миллонах хаписей на источнике и возвращает 33 млн. Это нормальная скорость для клика? SUBS_KEY текст, содержит 50% уникальных значений от источника.
Не сравнивали ключи в Hash128() завернуть, а потом уже group by?
источник

ZS

Zhenya Skrebanov in Qlik BI chat
Жанна Макрушина
Я имела в виду, чтобы время шло
now() не показывает время?
источник

ЕБ

Евгений Булаев... in Qlik BI chat
Анатолий Ветринцев
Всем привет:) Выше запрос. Он отрабатывает 50 минут на 38 миллонах хаписей на источнике и возвращает 33 млн. Это нормальная скорость для клика? SUBS_KEY текст, содержит 50% уникальных значений от источника.
именно данная резидентная загрузка 50 минут? без всего остального?
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Евгений Булаев
именно данная резидентная загрузка 50 минут? без всего остального?
Да
источник

ZS

Zhenya Skrebanov in Qlik BI chat
Members таблчка, в ней наверное 270 столбцов? И сама она занимает 2 гб на диске в QVD?
источник

ЕБ

Евгений Булаев... in Qlik BI chat
я так понимаю там в принципе уникальных сочетаний очень много, точно ли оперативки хватает и не уходит в файл подкачки в процессе расчета?
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Евгений Булаев
я так понимаю там в принципе уникальных сочетаний очень много, точно ли оперативки хватает и не уходит в файл подкачки в процессе расчета?
1ТБ всего, они конечно заняты, но не на столько
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Zhenya Skrebanov
Members таблчка, в ней наверное 270 столбцов? И сама она занимает 2 гб на диске в QVD?
1Гиг, около 100 столбцов.
Upd: даже около 60
источник

ЕБ

Евгений Булаев... in Qlik BI chat
2 варианта которые могут ускорить на этапе расчета:
1) попробуйте отдельно загрузить только эти 6 столбцов, а после уже резидентную загрузку.
2) резидентная загрузка с условием WHERE not exists (camp_id,context_member_id,subs_key) order by response_date desc, contact desc, said_yes desc. поля без группировки
источник

ЕБ

Евгений Булаев... in Qlik BI chat
есть ещё вариант с маппингом, но это выйдет во время на других этапах
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Евгений Булаев
2 варианта которые могут ускорить на этапе расчета:
1) попробуйте отдельно загрузить только эти 6 столбцов, а после уже резидентную загрузку.
2) резидентная загрузка с условием WHERE not exists (camp_id,context_member_id,subs_key) order by response_date desc, contact desc, said_yes desc. поля без группировки
Да там с источника только час лезет (oracle), а потом ещё group by 50 минут... в общем решу вопрос на стороне источника, там менее 10 минут вся логика с последующими запросами
источник

DS

Daniil Semenov in Qlik BI chat
Клик не распараллеливает обсчеты сам, поэтому массивные операции занимают много времени.
Можно попробовать сделать парамтеризированные скрипты загрузки и обрабатывать в несколько более мелких сегментов параллельными тасками, а потом всё законкатенировать.
источник

ZS

Zhenya Skrebanov in Qlik BI chat
Oracle > QVD > и потом уже ETL скрипта, я бы начал с этого.
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Daniil Semenov
Клик не распараллеливает обсчеты сам, поэтому массивные операции занимают много времени.
Можно попробовать сделать парамтеризированные скрипты загрузки и обрабатывать в несколько более мелких сегментов параллельными тасками, а потом всё законкатенировать.
Интересно, а как распараллелить внутри одного приложения?
источник

NK

ID:286908537 in Qlik BI chat
Коллеги, добрый день!
Подскажите пожалуйста, почем при попытке использовать данные в variable input, невозможно выбрать имя поля?
источник

NK

ID:286908537 in Qlik BI chat
источник

DS

Daniil Semenov in Qlik BI chat
Пишете qvs, переменными задаёте параметры, чтобы ваша большая таблица логически побилась на аналогичные, но меньшие по объёму.
Не уверен, что можно в таске передать параметр, но создать несколько одинаковых приложений, изменяя в нем только значения параметра - точно не большая проблема. В паблишере запускаете параллельно таски с каждым из этих приложений. По окончанию работы всех, конкатенируете результаты.
Это, безусловно, более трудоемко для разработчика, но время сократит существенно. Если ресурсы позволяют, конечно.
У нас расчёт остатков для кэшфлоу для разных версий так реализован, вместо последовательной обработки в пол часа, параллельная в 6 минут.
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
Daniil Semenov
Пишете qvs, переменными задаёте параметры, чтобы ваша большая таблица логически побилась на аналогичные, но меньшие по объёму.
Не уверен, что можно в таске передать параметр, но создать несколько одинаковых приложений, изменяя в нем только значения параметра - точно не большая проблема. В паблишере запускаете параллельно таски с каждым из этих приложений. По окончанию работы всех, конкатенируете результаты.
Это, безусловно, более трудоемко для разработчика, но время сократит существенно. Если ресурсы позволяют, конечно.
У нас расчёт остатков для кэшфлоу для разных версий так реализован, вместо последовательной обработки в пол часа, параллельная в 6 минут.
Понятно, подумаем, спасибо! Так мы наверное будем загружать с источника параллельными процессам, идея хорошая, за наводку отдельное спасибо! Но агрегировать проще на оракле в нашем случае. Лучше мы ускорим загрузку с него уже агрегированных данных наверное. Спасибо!
источник

АВ

Анатолий Ветринцев... in Qlik BI chat
А ещё вопрос, если столбец участвует в связи но участвует в поиске и выборах, модно по нему отключить индексацию без потери производительности?
источник

АЩ

Алексей Щеголев... in Qlik BI chat
Коллеги, кто то может пояснить,:
источник