Телеграмм чат группы tarantoolru страница 7005

Привет! А может кто-то подсказать пример проекта, на гитхабе например, реализующего простой апи доступа к данным в тарантуле? Чтобы понять, как это принято делать по-красоте в целом)

источник

20:13пожаловаться #6

2020 June 25

Igor Munkin in Tarantool

Yura Sokolov

Ну, от меня в коммите только упоминание.

Не, ну в конце концов он же взял 2 хэшфункции: быструю и для fallback-а.

источник

01:21пожаловаться #7

Igor Munkin in Tarantool

Yura Sokolov

Нет, безопасность только увеличилась.

Кстати, теперь получается одна и та же строка на разных запусках будет иметь разные хэшсуммы. Благо он чуть ранее избавился от захардкоженных чиселок в lj_cparse.c.

источник

01:23пожаловаться #8

Igor Munkin in Tarantool

Yura Sokolov

> Up to 40% faster on hash-intensive benchmarks.

Это потому, что теперь строки нумеруются, и в lua table вместо хэшсуммы от строки используется этот порядковый номер.
Порядковый номер, естественно, имеет заметно меньше коллизий (примерно на те 40%).
Хэшсумма теперь только в interning табличке роль играет.

AFAIU, замена на id использована ровно потому, что сейчас 2 функции и результат любой из них может быть представлена в s->hash. В результате ты не можешь по хеш-сумме сравнивать две строки без упражнений с s->hashalg и возможным вычислением суммы при различии этого поля у сравниваемых строк. В id, кстати, не всегда лежит порядковый номер (например, в случае LUAJIT_SECURITY_STRID = 3 там и вовсе будет псевдослучайная величина), но похоже и правда эти значения дают меньше коллизий.

источник

01:45пожаловаться #9

Andrey Privalov in Tarantool

Nemat Rakhmatov

Удалять можно и реже, наверное. Тут вопрос скорее в том, чтобы в среднем удалеть не меньше, чем вставляем. То есть. если вставка идет например 1000 таплов в секунду, то при удалении раз в сутки - это мне надо быстро удалить ~90 млн таплов. Если такое будет норм работать, то это бы устроило тоже

источник

11:11пожаловаться #10

Andrey Privalov in Tarantool

Хотя есть кейсы, когда мне не надо держать запись так долго - сутки, она мне нужна несколько минут. И тогда она лишнее место будет занимать тоже

источник

11:12пожаловаться #11

Dmitry Sharonov in Tarantool

а сколько вам реально надо удалений в сутки делать?

источник

11:13пожаловаться #12

Andrey Privalov in Tarantool

реально на 1 инстанс тарантула приходится по 1000 вставок в секунду. TTL у записей от минуты до пары суток

источник

11:15пожаловаться #13

Andrey Privalov in Tarantool

Ну то есть в итоге все равно, около 1000 в секунду

источник

11:15пожаловаться #14

Alexey Kuzin in Tarantool

У меня был кейс с удалением из винила, пришёл к выводу что лучше делать это мелкими пачками и по отдельным шардам, а не по порядку ключей

источник

11:16пожаловаться #15

Alexey Kuzin in Tarantool

(да, это был vshard поверх винила)

источник

11:16пожаловаться #16

Andrey Privalov in Tarantool

Что значит по отдельным шардам?

источник

11:16пожаловаться #17

Alexey Kuzin in Tarantool

Удаление запускалось раз в час и чистило порядка сотен записей

источник

11:17пожаловаться #18

Alexey Kuzin in Tarantool

Andrey Privalov

Что значит по отдельным шардам?

Если используется шардинг, то данные раскладываются по инстансам Тарантула в соответствии с ключом шардирования. Если ключ например зависит от числового ID клиента, то на первый инстанс попадут записи с ID = 1 и ID = 3, на второй — ID = 2, ID = 4 и т д

источник

11:18пожаловаться #19

Alexey Kuzin in Tarantool

ID взяты для примера

источник

11:18пожаловаться #20