Телеграмм чат группы pgsql страница 12461

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

pgsql – PostgreSQL

5915 membersпожаловаться на группу

2021 March 21

AS

Alexey Stavrov in pgsql – PostgreSQL

Yaroslav Schekin

Хмм... в какой "теории"? Я такой не помню, например (и неудивительно, как мне кажется — потому что см. https://t.me/pgsql/291614 ). ;)

> то b-tree в таком кейсе не самое лучшее решение.

Опять-таки, [citation needed]. Я к тому, что того, что кому-то "теоретически" кажется, что это так, недостаточно для того, чтобы так было в реальности.

> Нету ещё движков LSM-tree?

Кажется, нет. Но я специально не искал, а Вы?

Yaroslav Schekin in pgsql – PostgreSQL

Потому что это никому настолько не нужно. Т.е. отношение затрат и выгод на практике никогда не в пользу такого решения.

> что кому-то "теоретически" кажется

Вообще-то это известно, что b-tree лучше подходит, когда преобладает чтение (и когда обновляется произвольная запись), а lsm - при вставке (и когда обновляется недавно вставленная/обновленная запись). Я ссылками доказывать не буду, но это правда известно.

И ещё не очень понял, зачем Вы обвернули слово "теория" в кавычки. Какой смысл в этом?

> Но я специально не искал, а Вы?

Я искал год/полгода назад, но не видел. Находил только storage с undo log, как в MySQL, и, вроде бы, колоночный storage. Не помню их названия.

источник

20:04пожаловаться #1

YS

Yaroslav Schekin in pgsql – PostgreSQL

> что кому-то "теоретически" кажется

Вообще-то это известно, что b-tree лучше подходит, когда преобладает чтение (и когда обновляется произвольная запись), а lsm - при вставке (и когда обновляется недавно вставленная/обновленная запись). Я ссылками доказывать не буду, но это правда известно.

И ещё не очень понял, зачем Вы обвернули слово "теория" в кавычки. Какой смысл в этом?

> Но я специально не искал, а Вы?

Я искал год/полгода назад, но не видел. Находил только storage с undo log, как в MySQL, и, вроде бы, колоночный storage. Не помню их названия.

> Я ссылками доказывать не буду, но это правда известно.

А я утверждаю, что нет, не "известно". Всё зависит от условий и ограничений при применении, как обычно.

> Какой смысл в этом?

Смысл такой, что упуская (преднамеренно или нет) существенные для конкретной ситуации детали, можно сделать совершенно неправильные выводы (обратные тому, что будет при реализации и тестировании / использовании), например.
Поэтому подобная деятельность — это "теоретизирование", и больше ничего.

источник

20:19пожаловаться #2

VY

Victor Yegorov in pgsql – PostgreSQL

> что кому-то "теоретически" кажется

Вообще-то это известно, что b-tree лучше подходит, когда преобладает чтение (и когда обновляется произвольная запись), а lsm - при вставке (и когда обновляется недавно вставленная/обновленная запись). Я ссылками доказывать не буду, но это правда известно.

И ещё не очень понял, зачем Вы обвернули слово "теория" в кавычки. Какой смысл в этом?

> Но я специально не искал, а Вы?

Я искал год/полгода назад, но не видел. Находил только storage с undo log, как в MySQL, и, вроде бы, колоночный storage. Не помню их названия.

хм, надо же... у меня есть база, где под нагрузкой до 300MB/s транзакционного лога пишется. и 95% индексов — btree.

я бы вам рекомендовал поискать и почитать публикации на тему nbtree indexes in rdbms (в частности за авторством Shasha), разговор был бы более предметным.

источник

20:44пожаловаться #3

AS

Alexey Stavrov in pgsql – PostgreSQL

Yaroslav Schekin

> Я ссылками доказывать не буду, но это правда известно.

А я утверждаю, что нет, не "известно". Всё зависит от условий и ограничений при применении, как обычно.

> Какой смысл в этом?

Смысл такой, что упуская (преднамеренно или нет) существенные для конкретной ситуации детали, можно сделать совершенно неправильные выводы (обратные тому, что будет при реализации и тестировании / использовании), например.
Поэтому подобная деятельность — это "теоретизирование", и больше ничего.

> Всё зависит от условий и ограничений

Условия и ограничения назвал, не понимаю Вас. Т.е. паттерн, когда один хуже/лучше явно указан в нашем обсуждении.

> А я утверждаю, что нет, не "известно"

Не верите мне? Не надо. Вся первая страница поиска в Гугл по фразе "lsm vs b-tree" скажет вам тоже самое.

источник

20:48пожаловаться #4

ДЛ

Дмитрий Лукьянов... in pgsql – PostgreSQL

Коллеги, а подскажите, каким запросом лучше мониторить отставание реплики?
Просто есть у нас одна метрика, но по ночам в праймари ничего не происходит, нет передачи на реплику, и, соответственно, мониторинг постоянно алертит, что отстало...
Как вы решаете эту проблему? 🤔

источник

20:52пожаловаться #5

S

Susa in pgsql – PostgreSQL

Как хранить doc формат в postgresql. Ввиде html как string или в битах или грузить на s3 и хранить ссылку?

источник

20:53пожаловаться #6

ДЛ

Дмитрий Лукьянов... in pgsql – PostgreSQL

Сейчас вот так смотрим:

SELECT CASE WHEN pg_last_wal_receive_lsn() = pg_last_wal_replay_lsn() THEN 0   ELSE EXTRACT (EPOCH FROM now() - pg_last_xact_replay_timestamp())::INTEGER END AS lag;

источник

20:54пожаловаться #7

a

antuan in pgsql – PostgreSQL

Как хранить doc формат в postgresql. Ввиде html как string или в битах или грузить на s3 и хранить ссылку?

Если вопрос в формате голосования, то я за хранение ссылки в бд.

источник

20:54пожаловаться #8

YS

Yaroslav Schekin in pgsql – PostgreSQL

> Всё зависит от условий и ограничений

Условия и ограничения назвал, не понимаю Вас. Т.е. паттерн, когда один хуже/лучше явно указан в нашем обсуждении.

> А я утверждаю, что нет, не "известно"

Не верите мне? Не надо. Вся первая страница поиска в Гугл по фразе "lsm vs b-tree" скажет вам тоже самое.

> Условия и ограничения назвал, не понимаю Вас.

Но недостаточно подробно, как мне кажется.
Т.е. в указанных ограничениях результат может зависеть от "существенных для конкретной ситуации деталей", которые не обсуждались.

> Не верите мне? Не надо. Вся первая страница поиска в Гугл по фразе "lsm vs b-tree" скажет вам тоже самое

Послушайте, но это же argumentum ad populum просто не серьёзно. ;)
Т.е. "первая страница поиска в Гугл" по некоторым (многим?) запросам "скажет" мне простую, тривиально доказуемую неправду.

источник

21:01пожаловаться #9

AS

Alexey Stavrov in pgsql – PostgreSQL

хм, надо же... у меня есть база, где под нагрузкой до 300MB/s транзакционного лога пишется. и 95% индексов — btree.

я бы вам рекомендовал поискать и почитать публикации на тему nbtree indexes in rdbms (в частности за авторством Shasha), разговор был бы более предметным.

> где под нагрузкой до 300MB/s

Мне эти цифры ни о чем не говорят, особенно в контексте обсуждения b-tree vs lsm.
Покажите пример, где b-tree на запись ведет себя шустрее, чем lsm.

> почитать публикации на тему nbtree indexes in rdbms

Давайте попробую прочитать. Может прямо ссылку конкретную дадите, чтобы читал именно ту литературу, с которой вы знакомы?

источник

21:05пожаловаться #10

YS

Yaroslav Schekin in pgsql – PostgreSQL

Как хранить doc формат в postgresql. Ввиде html как string или в битах или грузить на s3 и хранить ссылку?

https://wiki.postgresql.org/wiki/BinaryFilesInDB </thread>

источник

21:06пожаловаться #11

S

Susa in pgsql – PostgreSQL

Yaroslav Schekin

https://wiki.postgresql.org/wiki/BinaryFilesInDB </thread>

👍

источник

21:08пожаловаться #12

VY

Victor Yegorov in pgsql – PostgreSQL

> где под нагрузкой до 300MB/s

Мне эти цифры ни о чем не говорят, особенно в контексте обсуждения b-tree vs lsm.
Покажите пример, где b-tree на запись ведет себя шустрее, чем lsm.

> почитать публикации на тему nbtree indexes in rdbms

Давайте попробую прочитать. Может прямо ссылку конкретную дадите, чтобы читал именно ту литературу, с которой вы знакомы?

Postgres — open-source. если вы уверены, что lsm лучше, то реализуйте и пользуйтесь, вам только спасибо скажут. тем более, что новые IndexAccess методы можно делать в виде расширений.

источник

21:31пожаловаться #13

YS

Yaroslav Schekin in pgsql – PostgreSQL

> где под нагрузкой до 300MB/s

Мне эти цифры ни о чем не говорят, особенно в контексте обсуждения b-tree vs lsm.
Покажите пример, где b-tree на запись ведет себя шустрее, чем lsm.

> почитать публикации на тему nbtree indexes in rdbms

Давайте попробую прочитать. Может прямо ссылку конкретную дадите, чтобы читал именно ту литературу, с которой вы знакомы?

А давайте я покажу. ;)
http://www.lmdb.tech/bench/inmem/
LMDB — это "широко известная в узких кругах" высокопроизводительная реализация ACID single-writer b-tree, если что.
А LSM в этом benchmark несколько.

В общем, я тут уже писал (несколько раз, кажется?) по этому поводу — b-tree в реальности (а не в "теоретических" мечтах) "победить" очень трудно, т.е. эта пакость структура данных в "нормальных" условиях зачастую выигрывает у "специализированных" под задачу структур данных (хотя, как кажется "теоретикам", не должна бы), или же не очень существенно проигрывает им.

источник

21:37пожаловаться #14

KK

Konstantin Knizhnik in pgsql – PostgreSQL

"Победить" B-Tree достаточно просто
Если интересно - почитайте
https://www.postgresql.org/message-id/flat/315b7ce8-9d62-3817-0a92-4b20519d0c51%40postgrespro.ru

PostgreSQL Mailing List Archives

LSM tree for Postgres

источник

21:40пожаловаться #15

KK

Konstantin Knizhnik in pgsql – PostgreSQL

LSM сейчас действительно очень популярна и используется во многих новомодных базах от тарантула и YDB до cockroach-а.
Правда оно проявляет себя в основном на вставках и в том случае, когда индекс существенно не влезает в память. Впрочем при теперешних размерах оперативки этого не так просто добиться:)

источник

21:43пожаловаться #16

МШ

Михаил Шурутов... in pgsql – PostgreSQL

Дмитрий Лукьянов

Коллеги, а подскажите, каким запросом лучше мониторить отставание реплики?
Просто есть у нас одна метрика, но по ночам в праймари ничего не происходит, нет передачи на реплику, и, соответственно, мониторинг постоянно алертит, что отстало...
Как вы решаете эту проблему? 🤔

Если версия >= 10, то *_lag в pg_stat_replication. Если меньше 10-й, то страдать.

источник

21:46пожаловаться #17

ДЛ

Дмитрий Лукьянов... in pgsql – PostgreSQL

Михаил Шурутов

Если версия >= 10, то *_lag в pg_stat_replication. Если меньше 10-й, то страдать.

12 версия... С виду есть инфа там. Спасибо. Будем курить тему...

источник

21:49пожаловаться #18

VY

Victor Yegorov in pgsql – PostgreSQL

Дмитрий Лукьянов

Коллеги, а подскажите, каким запросом лучше мониторить отставание реплики?
Просто есть у нас одна метрика, но по ночам в праймари ничего не происходит, нет передачи на реплику, и, соответственно, мониторинг постоянно алертит, что отстало...
Как вы решаете эту проблему? 🤔

если у вас нету вообще никакой активности на мастере, то это нормальное поведение, т.к. на реплику ничего не приезжает и время последнего replay всё время убегает в прошлое. настройте archive_timeout

источник

21:50пожаловаться #19

YS

Yaroslav Schekin in pgsql – PostgreSQL

Konstantin Knizhnik

"Победить" B-Tree достаточно просто
Если интересно - почитайте
https://www.postgresql.org/message-id/flat/315b7ce8-9d62-3817-0a92-4b20519d0c51%40postgrespro.ru

PostgreSQL Mailing List Archives

LSM tree for Postgres

Понимаете... если "подтасовать колоду" (т.е., например, сравнивать ACID b-tree и non-ACID LSM; или сравнивать single-threaded LSM игрушку с полноценным многопользовательским b-tree; или в benchmarks использовать исключительно "случайные" данные; или сравнивать "базовую" реализацию b-tree с сильно оптимизированным LSM и т.д. и т.п.), то "победить" очень легко.

И я почитал thread, да (и там люди тоже почему-то сомневаются, что эти результаты показывают / доказывают "победу").

Так что если Вам интересно — посмотрите http://www.lmdb.tech/bench/inmem/ ;)

источник

21:54пожаловаться #20