Size: a a a

2020 March 13

S

Stanislav in Data Engineers
что тебе даст знание того, что человек пошел на ютуб? все ходят на ютуб )
источник

S

Stanislav in Data Engineers
днс овер хттпс
источник

AS

Andrey Smirnov in Data Engineers
Stanislav
что тебе даст знание того, что человек пошел на ютуб? все ходят на ютуб )
как сказать, если человек ходит на рентв, то вероятность впарить ему какое-то чудодейственно средство гораздо выше
источник

AS

Andrey Smirnov in Data Engineers
Dmitry Zuev
С чего бы это. Ток хост
да, ошибся, только хост
источник

SU

Sergey Ufimtsev in Data Engineers
Ребят, привет у меня короч встал вопрос: Почему при сегментировании данных(напр. как в гринпламе) пропадет эффективность b-деревьев ? (мол индексы в гринпламе нет смысла юзать)
источник

А

Алексей in Data Engineers
Может потому что там в основном аналитические запросы по полной партиции и сегменту?
источник

SU

Sergey Ufimtsev in Data Engineers
Всё так, но если аналитические запросы подразумевают джоины, то не было бы быстрее если бы данные на одном сегменте имели индексы, для еще более быстрого джоина ?
источник

VP

Vitaly Pismarev in Data Engineers
Sergey Ufimtsev
Всё так, но если аналитические запросы подразумевают джоины, то не было бы быстрее если бы данные на одном сегменте имели индексы, для еще более быстрого джоина ?
Джойн по индексу далеко не всегда быстрее джойна без индекса
источник

PI

Pavel Ivanovsky in Data Engineers
Vitaly Pismarev
Джойн по индексу далеко не всегда быстрее джойна без индекса
это как так? full scan быстрее доступа по индексу?
источник

А

Алексей in Data Engineers
зачем джойну индекс, если это hash join?
источник

VP

Vitaly Pismarev in Data Engineers
Pavel Ivanovsky
это как так? full scan быстрее доступа по индексу?
Мне кажется это тема тянет на отдельный длинный разговор ) Но зависит от % запрашиваемых строк в таблице.
источник

SU

Sergey Ufimtsev in Data Engineers
А где про это почитать? Я понял бы если данные были бы еще и отсоритрованы по ключу сегмента, то за N. Если рассматривать каждую ноду гринплама как полноценный постгрес сервер, то по реляционной логике - хочешь джоины - делай индексы.
источник

PI

Pavel Ivanovsky in Data Engineers
Алексей
зачем джойну индекс, если это hash join?
ну hash это как бы есть индекс
источник

А

Алексей in Data Engineers
вопрос был про btree, насчет pg не уверен, но это обычно дерево, не хэш
источник

PI

Pavel Ivanovsky in Data Engineers
Vitaly Pismarev
Мне кажется это тема тянет на отдельный длинный разговор ) Но зависит от % запрашиваемых строк в таблице.
ну я думаю, что тут идет речь про условия, что запрашиваемых строк много меньше исходных
источник

А

Алексей in Data Engineers
что выгодней: фул скан или индекс определяет оптимизатор, примерно можно оценить самому, если посчитать на листочке
источник

А

Алексей in Data Engineers
формулы можно взять из книги Льюиса - основы стоимостной оптимизации
источник

VP

Vitaly Pismarev in Data Engineers
Pavel Ivanovsky
ну я думаю, что тут идет речь про условия, что запрашиваемых строк много меньше исходных
В исходном вопросе этого не было ) А использование ГП предполагает как раз большие выборки для аналитических запросов
источник

VP

Vitaly Pismarev in Data Engineers
Алексей
формулы можно взять из книги Льюиса - основы стоимостной оптимизации
Да, чтиво годное, хоть и уже давно устаревшее поскольку оптимизатор оракла давно убежал вперёд а Льюис за ним не успевает
источник

PI

Pavel Ivanovsky in Data Engineers
Vitaly Pismarev
В исходном вопросе этого не было ) А использование ГП предполагает как раз большие выборки для аналитических запросов
просто контекст изначально не понял
источник