как можно оптимальнее сделать проверку, есть ли определенный урл (например) уже в базе, чтоб при повторных включениях паука он на этот урл не шел? грузить весь список уже имеющихся урлов из базы перед запуском паука думаю совсем не оптимально
ну тут два варианта, либо каждый раз ходить в базу, либо держать в памяти 🤷♂️