Size: a a a

2021 June 13

A

Andrii in Scrapy
а можно как-то пропускать страницу если она уже закеширована в скрейпи?
источник

SS

Stepan Smirnov in Scrapy
Deltafetch/scrapy-crawl-once?
источник

A

Andrii in Scrapy
проблема что у меня уже есть кеш на пару млн страниц и мне не нужно их обходить, но у меня нет списка етих страниц :( но мне нужно еще спарсить пару млн
источник

AR

Andrey Rahmatullin in Scrapy
сделай свой мидлварь, который проверяет реквест по этому списку
источник

AR

Andrey Rahmatullin in Scrapy
тьфу
источник

AR

Andrey Rahmatullin in Scrapy
я понял
источник

AR

Andrey Rahmatullin in Scrapy
проверяй респонс на флаг cached и скипай
источник

AR

Andrey Rahmatullin in Scrapy
в колбэке
источник

A

Andrii in Scrapy
Оооо
источник

A

Andrii in Scrapy
Спасибо
источник
2021 June 14

М

Мур in Scrapy
Прошу прощения что так поздно, но у меня такой вопрос странный
источник

М

Мур in Scrapy
Может ли прокси вернуть не мою целевую страницу?
источник

М

Мур in Scrapy
Смотрю на логи перехожу руками в браузер там то что мне надо, а паук забирает вообще другую инфу?
источник

М

Мур in Scrapy
Но так только с частью респонсов
источник

М

Мур in Scrapy
Большая часть возвращает то что надо
источник

O

OxYgEn in Scrapy
может кто помочь, у меня есть массив прокси, вида mas=['9.9345.345.345','546.3456.4356']. Как мне реализовать смену в коде на рандомный из массива
источник

SS

Stepan Smirnov in Scrapy
https://github.com/xiaowangwindow/scrapy-rotated-proxy (я год назад использовал это решение)
есть еще
https://github.com/TeamHG-Memex/scrapy-rotating-proxies

если массив регулярно/автоматически менятся - писать свой middleware
источник

NS

Nikolay Semenov in Scrapy
Подскажите пж! Нужно сделать 2 последовательных запроса. Но второй запрос перенаправляется.
источник

NS

Nikolay Semenov in Scrapy
Вот мой код и лог
источник

NS

Nikolay Semenov in Scrapy
источник