Один паук генерирует до 1.000.000 уникальных item'ов за пробег, при этом ожидается что паук встретит большое количество дубликатов (в несколько раз больше).
Каждый item имеет уникальный sku (8 цифр).
Одновременно работает 25 пауков (версии сайта для разных стран) на нескольких серверах, список уже встреченных item'ов нужно сделать доступным для каждого паука.
В среднем будет генерироваться 3.000 item'ов/минуту.
Какие инструменты, либы стоит использовать для фильтрации дубликатов?