Size: a a a

2020 December 07

AR

Andrey Rahmatullin in Scrapy
ты отправляешь тот же запрос второй раз, дупфильтр его режет
источник

AR

Andrey Rahmatullin in Scrapy
это, впрочем, и в логе написано
источник

S

SoHard 🎄 in Scrapy
Пастырь
check_url работает корректно, но вот колбек parse_user_data не отрабатывает :/
потому что он не нужен
источник

S

SoHard 🎄 in Scrapy
совмести эти два колбэка
источник

К

Кирилл in Scrapy
Да, в первом варианте, ты модифицировал ссылку и запрашивал другую старницу. А тут та же самая, просто сразу её используй
источник

П

Пастырь in Scrapy
Как я вижу работу программы:
1. Собираю все ссылки и отправляю на проверку
2. Проверка срабатывает, отправляет страницу на парсинг
3. Парсинг
источник

К

Кирилл in Scrapy
ну добавь тогда dont_filter=True
источник

К

Кирилл in Scrapy
но это ерунда
источник

S

SoHard 🎄 in Scrapy
Кирилл
ну добавь тогда dont_filter=True
х2 запросы
источник

П

Пастырь in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
yield from
источник

AR

Andrey Rahmatullin in Scrapy
а, там не генератор
источник

S

SoHard 🎄 in Scrapy
тогда уж yield from self.parse_user_data(response)
источник

AR

Andrey Rahmatullin in Scrapy
ну и зачем селф-то передавать второй раз
источник

П

Пастырь in Scrapy
Спасибо! Получилось
источник

П

Пастырь in Scrapy
Не знал что он дубликаты удаляет и передавал урл который уже был
источник

AR

Andrey Rahmatullin in Scrapy
лог не читал потому что
источник

П

Пастырь in Scrapy
А куда я могу куки положить в Кравлера?
источник

AR

Andrey Rahmatullin in Scrapy
X-Crawlera-Cookies: disable и менеджить в пауке как обычно
источник

B

Bulatbulat48 in Scrapy
Andrey Rahmatullin
X-Crawlera-Cookies: disable и менеджить в пауке как обычно
они вроде только на Enterprise тарифе включены
источник