Телеграмм чат группы pgsql страница 12464

2021 March 22

AS

А если в узлах хранить дельты на каждую транзакцию, то все узлы будут сильно распухать, зато конкурентоность увеличится....

источник

10:47пожаловаться #1

кн

коля николай... in pgsql – PostgreSQL

Yaroslav Schekin

Не "запушит" (никто такую дрянь вещь не даст заcommit-ить в PostgreSQL), соответственно не будете и не решите. ;)

Эх, тогда придется по старинке)

источник

10:56пожаловаться #2

АХ

Александр Хакимов... in pgsql – PostgreSQL

Парни, помогите советом, у меня тут таблица разжирела, последний раз когда я на неё смотрел, в ней было более 2 млн записей.
Сейчас вообще не могу с ней ничего сделать, селект запрос пишу, в себя уходит думает. Делет запрос пишу , думает. В общем любое действие с таблицей превращается в запрос который улетает и никогда не возвращается

источник

10:59пожаловаться #3

🔥Э

🔥 Хамон Эврибади... in pgsql – PostgreSQL

Александр Хакимов

Парни, помогите советом, у меня тут таблица разжирела, последний раз когда я на неё смотрел, в ней было более 2 млн записей.
Сейчас вообще не могу с ней ничего сделать, селект запрос пишу, в себя уходит думает. Делет запрос пишу , думает. В общем любое действие с таблицей превращается в запрос который улетает и никогда не возвращается

Индексы

источник

11:00пожаловаться #4

АХ

Александр Хакимов... in pgsql – PostgreSQL

Пробовал перезапускать пролностью сервис постгресса, убил все возможные процессы которые могут работать с этой таблицей. и пытаюсь в неё хотя бы делет запрос и вакум пропихать , но не выходит

источник

11:00пожаловаться #5

AS

Alexey Stavrov in pgsql – PostgreSQL

Поробуйте в pg_stat_activity посмотреть, блокируются ли запросы кем-то

источник

11:01пожаловаться #6

YS

Yaroslav Schekin in pgsql – PostgreSQL

Konstantin Knizhnik

Я не подтосовывал колоду. Я сравнивал Постгрес с RocksDB где LSM вполне себе ACID-ая. И с своим собственным расширением lsm3, которое на самом деле не фига не LSM, а "вариация на тему", сделанная на базе 3ёх обчных постгресовый btree, со всеми сопутствующими ACIDными гарантиями.

Вот приведённая ссылка на in-memory беннчмарк, как раз на мой взгляд совершенно не уместна, потому как преимущество LSM как раз обеспечивается в том случае, когда индекс не влезает в память.

Я не утверждал, что LSM всегда и на любой нагрузке лучше,чем B-Tree. Как раз наоборот. Но есть use case, на котором оно однозначно и убедительно выигрывает: вставки случайных ключей в большую тблицу с запасом не влезающую в память. Насколько это "синтетический"use case? Я не знаю. Но у нас в ПгПро было множество заказчиков, у которых профиль нагрузки был именно такой.

Почему в данном случае классическое Б-Дерево тормозит?Потому чтобы сделать поиск или вставку случайного ключа нужно прочитать несколько (зависит от глубины дерева) страниц с диска. Обычно это 1-2 страницы, верхушка дерева всё таки влезает в кэш. Среднее время чтения с жёсткого диска 10msec. Т.е. 100 таких операций в секунду. Соотвественно даже если нам надо читать всего одну листьевую страничку у нас TPS-ы получаются ограниченными этой 100-ей. В NVM скорость случайных чтений на порядок быстрее. Но всё ещё на порядки уступает скорости доступа к памяти.

LSM-у же не надо ничего читать с диска, чтобы сделать вставку. Он просто вставляет в ключ в верхушку пирамиды, которая расположена в памяти, а потом в бэкграунде оно сливается с нижними уровнями. Сливание - это последовательное чтение и запись, что диски умеют делать достаточно хорошо. Отсюда и получается разница в скорости в разы. Начиная с какого-то момента скорость вставки в B-Tree начинает резко падать пока не упирается в скорость случайного чтения. А скорость LSM-а остаётся более менее постоянной.

Кто не верит - может сам взять тест и проверить. Или написать свой. Требуется только соблюдение трёх условий:
- преобладание вставок, причём без проверок уникальности
- случайное распределение ключей
- индекс не влезает в память
Как видно - это достаточно ограниченный сценарий. Поэтому речь не коим образом не идёт о замене B-Treа на LSM.
Но понимать когда LSM может обеспечит существенный выигрыш в скорости - весьма ИМХО полезно

> Я не подтосовывал колоду.

Что касается этого benchmark, мне тоже кажется, что тест "оторванный от реальных практических метрик (синтетический)". Я не имел в виду того, что Вы так поступили преднамеренно.

> Я сравнивал Постгрес с RocksDB где LSM вполне себе ACID-ая.

Дьявол в деталях.

> Вот приведённая ссылка на in-memory беннчмарк, как раз на мой взгляд совершенно не уместна

То есть против того, что в типичном случае (а это не когда индекс "влезает в память", а когда его "горячая" часть туда влезает, а она может быть в сотни раз меньше!) LSM проигрывает, у Вас возражений нет? ;)
Тогда пойдём дальше, вот ссылка на RocksDB vs LMDB уже в существенной степени не в RAM: https://www.mdeditor.tw/pl/2cBB

> Я не утверждал, что LSM всегда и на любой нагрузке лучше, чем B-Tree. Как раз наоборот.

Вот именно.

> Насколько это "синтетический" use case?

Может быть, разработчики других general-purpose RDBMS кардинально ошибаются, когда считают этот случай [очень] редким (и, соответственно, не используют LSM trees для on-disk indexes)?
Мне он тоже кажется очень редким, но уверенности у меня нет.

А давайте спросим присутствующих.

> Но есть use case, на котором оно однозначно и убедительно выигрывает вставки случайных ключей в большую таблицу, с запасом не влезающую в память.

Коллеги, это редкий случай, как вам кажется?

> Но у нас в ПгПро было множество заказчиков, у которых профиль нагрузки был именно такой.

Непустое множество, Вы имели в виду? (шутка) Т.е. статистика у Вас есть?

> СЛиваение - это последовательное чтение и запись, что диски умеют делать достаточно хорошо.

Примерно так же, как современные диски умеют делать и произвольную... но всё это в общем и целом "теоретически" верно.

> Кто не верит - может сам взять тест и проверить. Или написать свой.

А у кого нет времени заниматься этой ерундой этим — может помолчать? ;)
Нет, ну правда, хочется потратить время как то полезнее / приятнее, чем на то, чтобы убеждаться в очевидных, но не относящихся к делу (IMNSHO) вещах.

> Как видно - это достаточно ограниченный сценарий.

Вот именно. Поэтому (по "сопутствующим" причинам, точнее), по моему мнению, LSM в самом PostgreSQL не нужен.
Но если кто-то готов написать, выложить и поддерживать качественное расширение — им и карты в руки.

> Но понимать когда LSM может обеспечит существенный выигрыш в скорости - весьма ИМХО полезно.

Понимать, когда что-то может обеспечить существенный выигрыш, в принципе полезно, да.
И это также даёт понимание того, что, ловко подбирая условия, можно показать "преимущество" почти чего угодно перед чем угодно.

источник

11:08пожаловаться #7

ГА

Георгий Ава... in pgsql – PostgreSQL

Столкнулся с таким случаем, при вызове
EXECUTE 'alter subscription sub_1 refresh publication' ;
из триггера, убивается postgres и уходит в постоянный ребут.

источник

11:10пожаловаться #8

МШ

Михаил Шурутов... in pgsql – PostgreSQL

Александр Хакимов

Парни, помогите советом, у меня тут таблица разжирела, последний раз когда я на неё смотрел, в ней было более 2 млн записей.
Сейчас вообще не могу с ней ничего сделать, селект запрос пишу, в себя уходит думает. Делет запрос пишу , думает. В общем любое действие с таблицей превращается в запрос который улетает и никогда не возвращается

https://t.me/pgsql/288632

Yaroslav Schekin in pgsql – PostgreSQL

Покажите версию PostgreSQL, запрос, \d каждой используемой таблицы, EXPLAIN (ANALYZE, BUFFERS).
Последнее лучше на https://explain.depesz.com/

источник

11:10пожаловаться #9

YS

Yaroslav Schekin in pgsql – PostgreSQL

Александр Хакимов

Парни, помогите советом, у меня тут таблица разжирела, последний раз когда я на неё смотрел, в ней было более 2 млн записей.
Сейчас вообще не могу с ней ничего сделать, селект запрос пишу, в себя уходит думает. Делет запрос пишу , думает. В общем любое действие с таблицей превращается в запрос который улетает и никогда не возвращается

Раз "не возвращается", покажите просто EXPLAIN, без (ANALYZE, BUFFERS) (но и всё остальное, конечно!), что поделаешь.

источник

11:16пожаловаться #10

DS

Daniella Starchenko in pgsql – PostgreSQL

Какие могут быть негативные последсвия при изменении параметра block_size для уже работающей базы? Причем интересует изменение как в большую, так и в меньшую сторону.

источник

11:16пожаловаться #11

VY

Victor Yegorov in pgsql – PostgreSQL

Daniella Starchenko

Какие могут быть негативные последсвия при изменении параметра block_size для уже работающей базы? Причем интересует изменение как в большую, так и в меньшую сторону.

невозможно, это параметр компиляции, база не запустится, если попытаться поднять исходники с одним размером против директории с другим размером

источник

11:17пожаловаться #12

АХ

Александр Хакимов... in pgsql – PostgreSQL

Михаил Шурутов

https://t.me/pgsql/288632

Yaroslav Schekin in pgsql – PostgreSQL

Покажите версию PostgreSQL, запрос, \d каждой используемой таблицы, EXPLAIN (ANALYZE, BUFFERS).
Последнее лучше на https://explain.depesz.com/

это шутка?

источник

11:18пожаловаться #13

МШ

Михаил Шурутов... in pgsql – PostgreSQL

В смысле?

источник

11:18пожаловаться #14

YS

Yaroslav Schekin in pgsql – PostgreSQL

Александр Хакимов

это шутка?

Нет, это то, что Вам нужно показать.
Если отказываетесь — лучше поищите помощь где-то в другом месте, честное слово.

источник

11:19пожаловаться #15

AS

Alexey Stavrov in pgsql – PostgreSQL

А мне кажется, что ему нужно посмотреть в pg_stat_activity, потому что в его сообщении говорится, что ЛЮБОЙ запрос к этой таблице уходит в себя, а значит и запрос select * from table limit 1, после чего смысла смотреть в план я не вижу

источник

11:20пожаловаться #16

А

Александр in pgsql – PostgreSQL

ребзи, у меня к примеру 1,2,3,4....412, 414, 415 и т.д. Вот мне надо свободный индекс взять 413, чтобы присвоить его юзеру. Каким образом я могу до него достучаться с помощью запроса в субд? Или тут только взять массив этих элементов и уже самому построить логику внутри среды

источник

11:22пожаловаться #17

YS

Yaroslav Schekin in pgsql – PostgreSQL

Alexey Stavrov

А мне кажется, что ему нужно посмотреть в pg_stat_activity, потому что в его сообщении говорится, что ЛЮБОЙ запрос к этой таблице уходит в себя, а значит и запрос select * from table limit 1, после чего смысла смотреть в план я не вижу

Тоже возможно, да. Но он же нам это скажет (что и обычный EXPLAIN "завис"), я надеюсь. ;)

источник

11:22пожаловаться #18

YS

Yaroslav Schekin in pgsql – PostgreSQL

Георгий Ава

Столкнулся с таким случаем, при вызове
EXECUTE 'alter subscription sub_1 refresh publication' ;
из триггера, убивается postgres и уходит в постоянный ребут.

А какая версия PostgreSQL? Если последний minor любой версии — пишите bug report, что ж.

источник

11:23пожаловаться #19

b

batyrmastyr in pgsql – PostgreSQL

А в архиве точно бинарники есть или это всё же исходники которые скомпилировать нужно?

источник

11:24пожаловаться #20