Телеграмм чат группы pgsql страница 12435

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

pgsql – PostgreSQL

5886 membersпожаловаться на группу

2021 March 18

s

sexst in pgsql – PostgreSQL

Yaroslav Schekin

Поставлю, да. Потому что если не поставить, система ввода-вывода "перегрузится до неюзабельности" от кое-чего другого.
Проблема-то в том, что это всё происходит... не в вакууме. ;)

А я за контролируемое постепенное доведение до нуля, главное чтобы хлам быстрее очищался чем копился в принципе.

источник

15:05пожаловаться #1

YS

Yaroslav Schekin in pgsql – PostgreSQL

Gonchik Tsymzhitov

Привет!
подскажите, в таблице jiraissue, примерно 700к записей,
а fileattachment - 870к.

следующий запрос выполняется более получаса

select count(*) from fileattachment where issueid not in (select id from jiraissue);

подскажите, какой параметр отвечает на подзапросы. Хочется именно ускорить подзапросы

Никакой. Не используйте NOT IN, см. https://wiki.postgresql.org/wiki/Don%27t_Do_This#Don.27t_use_NOT_IN

источник

15:06пожаловаться #2

YS

Yaroslav Schekin in pgsql – PostgreSQL

А я за контролируемое постепенное доведение до нуля, главное чтобы хлам быстрее очищался чем копился в принципе.

Это, конечно, прекрасно... в теории.
Но на практике, как мне кажется, сделать это не так просто, и отнимает у выполняющего куда больше времени.

источник

15:08пожаловаться #3

VY

Victor Yegorov in pgsql – PostgreSQL

Yaroslav Schekin

Просто мне это не кажется таким уж жёстким (особенно, если иметь в виду альтернативу).
А что Вы делаете вместо этого, если подробнее?

проблема не только в задержках, но и в том, что вакуум не считает нужным что-то делать. поэтому:
- понижаем на порядок scale_factor
- понижаем до 10 или до 5 cost_delay (зависит от дисков)
- руками вакуумируем самые проблемные (большие) таблицы
- проверяем “возраст” таблиц, вакуумируем те, что близки к anti-wraparround
- после стабилизации, ставим cost_delay в районе 2-5
- мониторим “наполненность” воркеров вакуума (если заняты все какое-то время — повод смотреть настройки)

источник

15:08пожаловаться #4

s

sexst in pgsql – PostgreSQL

Yaroslav Schekin

Это, конечно, прекрасно... в теории.
Но на практике, как мне кажется, сделать это не так просто, и отнимает у выполняющего куда больше времени.

Главное чтобы прод гладко работал =)

источник

15:08пожаловаться #5

МШ

Михаил Шурутов... in pgsql – PostgreSQL

Gonchik Tsymzhitov

Привет!
подскажите, в таблице jiraissue, примерно 700к записей,
а fileattachment - 870к.

следующий запрос выполняется более получаса

select count(*) from fileattachment where issueid not in (select id from jiraissue);

подскажите, какой параметр отвечает на подзапросы. Хочется именно ускорить подзапросы

from fileattachment left join jiraissue дальше думать головой и соображать мозгами.

источник

15:09пожаловаться #6

GT

Gonchik Tsymzhitov in pgsql – PostgreSQL

Михаил Шурутов

from fileattachment left join jiraissue дальше думать головой и соображать мозгами.

ok, 🙂 пойду создам задачу на переписку ORM

источник

15:13пожаловаться #7

YS

Yaroslav Schekin in pgsql – PostgreSQL

Главное чтобы прод гладко работал =)

Тогда легче купить адекватное "железо", чем выбрасывать тратить деньги на зарплату DBA, чтобы он дни и ночи проводил в обнимку с сервером. ;)

источник

15:13пожаловаться #8

МШ

Михаил Шурутов... in pgsql – PostgreSQL

Нормальные ОРМ умеют в raw-SQL.

источник

15:14пожаловаться #9

YS

Yaroslav Schekin in pgsql – PostgreSQL

Gonchik Tsymzhitov

ok, 🙂 пойду создам задачу на переписку ORM

Just FYI, позиция проекта PostgreSQL по поводу бездарно написанных ORM сводится к тому, что это их проблемы.
И её изменений, к счастью, не предвидится. ;)

источник

15:15пожаловаться #10

D

Denis in pgsql – PostgreSQL

Yaroslav Schekin

> Если есть но данные "грязные" - все тоже самое, но отнять 30

Да нет же!
20 отнимается как раз тогда, когда страница чистая! Вы понимаете, почему?
Я Вас уже в третий раз спрашиваю (кажется) — что vacuum делает со страницами с точки зрения терминологии clean/dirty?

Тут зависит от ситуации, как я понимаю

Если страница которую мы хотим обработать в shared_memory отсутствует, то ее надо прочитать это - cllean, нужно создать новую страницу, испачкать ее и засинкать на диск

Если это данные которые все еще есть, и они в shared_memory и на диске одинаковые, то автовакуум должен испачкать страницу и засинкать это на диск

Если данные в shared_memory и на диске не одинаковые - страница уже испачкана до нас - нужно засинкать, снова испачкать и засинкать

Так же все?

источник

15:22пожаловаться #11

YS

Yaroslav Schekin in pgsql – PostgreSQL

проблема не только в задержках, но и в том, что вакуум не считает нужным что-то делать. поэтому:
- понижаем на порядок scale_factor
- понижаем до 10 или до 5 cost_delay (зависит от дисков)
- руками вакуумируем самые проблемные (большие) таблицы
- проверяем “возраст” таблиц, вакуумируем те, что близки к anti-wraparround
- после стабилизации, ставим cost_delay в районе 2-5
- мониторим “наполненность” воркеров вакуума (если заняты все какое-то время — повод смотреть настройки)

Я сильно не думал, но разве это не другая проблема?
Я имел в виду ситуацию, когда autovacuum "вовсю" (согласно текущим настройкам) работает, но не справляется.

источник

15:24пожаловаться #12

D

Denis in pgsql – PostgreSQL

и тогда получается первый случай это miss
второй - hit
третий - durty

источник

15:24пожаловаться #13

YS

Yaroslav Schekin in pgsql – PostgreSQL

Тут зависит от ситуации, как я понимаю

Если страница которую мы хотим обработать в shared_memory отсутствует, то ее надо прочитать это - cllean, нужно создать новую страницу, испачкать ее и засинкать на диск

Если это данные которые все еще есть, и они в shared_memory и на диске одинаковые, то автовакуум должен испачкать страницу и засинкать это на диск

Если данные в shared_memory и на диске не одинаковые - страница уже испачкана до нас - нужно засинкать, снова испачкать и засинкать

Так же все?

Почти, но нет. Короче:
1. После работы vacuum страница всегда грязная (но она могла быть такой и до).
2. "Синкать" что-то куда-то — это не задача vacuum, и он этим не занимается.

> нужно создать новую страницу, испачкать ее и засинкать на диск

Просто считать. По sync — выше.

> нужно засинкать, снова испачкать и засинкать

Как раз и нет, это самый дешёвый случай — была грязная и такой и останется, sync чего-то — не проблема vacuum.

источник

15:28пожаловаться #14

s

sexst in pgsql – PostgreSQL

Yaroslav Schekin

Тогда легче купить адекватное "железо", чем выбрасывать тратить деньги на зарплату DBA, чтобы он дни и ночи проводил в обнимку с сервером. ;)

<Шутка про то, что один ssd заменяет двух dba>

источник

15:35пожаловаться #15

AT

Andrey Tatarnikov in pgsql – PostgreSQL

А есть ли вообще смысл так глубоко закапываться в тюнинг автовакуума "просто штоб было"? То есть пока проблем не видно. Кажется, нету.

источник

15:37пожаловаться #16

AG

Alex Grigorev in pgsql – PostgreSQL

Добрый день! кто-нибудь сталкивался с таким?: постгрес нагружается по CPU (делит ресурсы с другими тачками в vmware), после освобождения ресурсов продолжает тупить.. решается рестартом сервиса.. мб планировщик как-то запоминает что CPU "плохой" и продолжает в том же режиме работать? что можно дернуть без рестарта?

источник

15:39пожаловаться #17

D

Denis in pgsql – PostgreSQL

Yaroslav Schekin

Почти, но нет. Короче:
1. После работы vacuum страница всегда грязная (но она могла быть такой и до).
2. "Синкать" что-то куда-то — это не задача vacuum, и он этим не занимается.

> нужно создать новую страницу, испачкать ее и засинкать на диск

Просто считать. По sync — выше.

> нужно засинкать, снова испачкать и засинкать

Как раз и нет, это самый дешёвый случай — была грязная и такой и останется, sync чего-то — не проблема vacuum.

тогда, если случай когда страница уже грязная, самый дешевый, почему в дефолтных параметрах он стоит как самый дорогой?

источник

15:42пожаловаться #18

YS

Yaroslav Schekin in pgsql – PostgreSQL

тогда, если случай когда страница уже грязная, самый дешевый, почему в дефолтных параметрах он стоит как самый дорогой?

Не стоит! Процитируйте мне это (мне уже начинает казаться, что Вы где-то не то и не там читаете, честное слово).

источник

15:44пожаловаться #19

D

Denis in pgsql – PostgreSQL

что процитировать?
Я сейчас смотрю на конфиг постгреса в который эти параметры приехали с пакетом

источник

15:47пожаловаться #20