Телеграмм чат группы ru

Ну вот они теперь заменяют IN(...константные значения...) на IN(...фиктивный подзапрос сгенерированный на лету...) - в чём прикол? Почему это вдруг становится быстрее?

источник

23:08пожаловаться #4

SS

Sveta Smirnova in ru_mysql

Petr Myazin

Ну вот они теперь заменяют IN(...константные значения...) на IN(...фиктивный подзапрос сгенерированный на лету...) - в чём прикол? Почему это вдруг становится быстрее?

Sergei может знать =)

источник

23:09пожаловаться #5

SS

Sveta Smirnova in ru_mysql

@confguru теперь лучше? ;)

источник

23:10пожаловаться #6

AS

Alexandr Smirnov in ru_mysql

Ага

источник

23:12пожаловаться #7

AS

Alexandr Smirnov in ru_mysql

Спасибо

источник

23:12пожаловаться #8

2018 May 26

NI

Nickolay Ihalainen in ru_mysql

Petr Myazin

Ну вот они теперь заменяют IN(...константные значения...) на IN(...фиктивный подзапрос сгенерированный на лету...) - в чём прикол? Почему это вдруг становится быстрее?

Эта оптимизация применяется если количество элементов в in больше чем in_subquery_conversion_threshold=10000. Для маленького количество элементов применяется index dives https://dev.mysql.com/doc/refman/8.0/en/range-optimization.html (меньше eq_range_index_dive_limit=200), чтобы узнать сколько же строчек мы получим для каждого значения из IN. При этом потребляется 125 или 700 байт на каждое значение в in, но не более чем range_optimizer_max_mem_size байт на весь запрос. Таким образом, без использования "select * from (VALUES (1,2),(3,4)) t1 (c1,c2);" (этого синтаксиса нет в mysql) приходилось делать явную временную таблицу с которой джойнить оригинальный запрос без IN c тысячами значений. Почему становится быстрее: если index dives не сработали (из-за количества элементов или памяти), то приходится игнорировать условие с IN. Это может быть к лучшему, а может и приводить к сильному замедлению на табличках с миллионами-миллиардами строк.

источник

05:37пожаловаться #9

NI

Nickolay Ihalainen in ru_mysql

Быстрее с in_subquery_conversion_threshold становится, т.к. на временной табличке со значениями будет статистика и не надо каждое значение из IN проверять на количество строк.

источник

05:40пожаловаться #10

PM

Petr Myazin in ru_mysql

Nickolay Ihalainen

Быстрее с in_subquery_conversion_threshold становится, т.к. на временной табличке со значениями будет статистика и не надо каждое значение из IN проверять на количество строк.

Статистика на временной таблице - это интересно, не знал, спасибо!

источник

10:56пожаловаться #11

NI

Nickolay Ihalainen in ru_mysql

> Статистика на временной таблице
я про create temporary table ids_tmp (id int primary key); insert into ids_tmp values (1),(2),...,(19834); select * from t inner join ids_tmp on t.id = ids_tmp.id; вместо select * from t where id in (1,...,19834);

источник

10:58пожаловаться #12

NI

Nickolay Ihalainen in ru_mysql

неявные таблички https://dev.mysql.com/doc/refman/5.7/en/internal-temporary-tables.html не имеют индексов, так что кроме количества строк у оптимизатора ничего нет по ним.

источник

11:02пожаловаться #13

PM

Petr Myazin in ru_mysql

Раньше был такой совет. Допустим у меня большая таблица с товарами (100тыщ строк), пользователь на сайте выставляет фильтры, результат ему нужно выдать с пажинацией по 100шт. Я на PHP формирую два запроса. Первый выбирает исключительно ID товаров SELECT ID FROM goods WHERE ...фильтры пользователя... ORDER BY price LIMIT 100; - говорят, если выбирать только ID, то движку будет проще. А вторым запросом по уже найденной сотне ID я выбираю всю информацию о товарах: SELECT * FROM goods WHERE ID IN (...здесь прямым текстом подставлены ids найденные предыдущим запросом...) ORDER BY price

источник

11:04пожаловаться #14

PM

Petr Myazin in ru_mysql

Это имеет какой-то смысл в современных реалиях или это «мифы оптимизации»?

источник

11:05пожаловаться #15

PM

Petr Myazin in ru_mysql

И таких IN запросов у меня полно по всей системе

источник

11:06пожаловаться #16

NI

Nickolay Ihalainen in ru_mysql

это late row lookup, https://explainextended.com/2009/10/23/mysql-order-by-limit-performance-late-row-lookups/ надо смотреть explain для конкретного запроса. вместо двух запросов достаточно subselect.

EXPLAIN EXTENDED

MySQL ORDER BY / LIMIT performance: late row lookups

A late row lookup requires that the engine looks up a row in a table only if it had not been filtered by the index. MySQL is not capable of doing this but this can be emulated. It improves the LIMIT performance and filtering efficiency on the indexed fields

источник

11:07пожаловаться #17

PM

Petr Myazin in ru_mysql

Спасибо за ссылку, сейчас почитаю

источник

11:08пожаловаться #18

NI

Nickolay Ihalainen in ru_mysql

обычно большие списки id лезут из внешних систем, типа sphinx search или от хранения массивов в виде текстовых списков, вместо табличек связи один ко многим

источник

11:08пожаловаться #19

PM

Petr Myazin in ru_mysql

Прочитал статью, всё очень доходчиво расписано, похоже я эмулирую subselect на PHP

источник

11:17пожаловаться #20