Если кому интересно, отвечу на один из своих предыдущих вопросов: " можно ли использовать единый файл requests.seen для нескольких пауков " - можно (условно), если использовать один и тот же путь JOB_DIR.
requests.seen - файл, либо список в памяти, в который записываются хеши запросов (т.н. fingerprints). Записывает их RFPDupeFilter для фильтрации дубликатов перед тем, как отдать downloader'у.
Если в настройках указать JOB_DIR, то появляется данный файлик, и при каждом запуске все запросы, совпадающие с хешами из него игнорируются.
З.Ы: при использовании одного файла несколькими процессами мы естественно столкнемся с блокировками...