Size: a a a

2021 June 01

(

(o_O) in Scrapy
Если у тебя новый адрес с каждым запросом, просто выключи куки
источник

G

Georgiy in Scrapy
я бы еще scrapy.spidermiddlewares.referer.RefererMiddleware отключил
источник

V

Victor in Scrapy
Меня смущает, что при решении капчи там кроме капчи уходит еще инфа о браузере если js включен
источник

AR

Andrey Rahmatullin in Scrapy
можно попробовать менеджить кукиджары там же где менеджишь прокси
источник

МС

Михаил Синегубов... in Scrapy
написать мидлварь которая по ключу=прокся, будет отдавать ID  cookiejar и подставлять его в запрос.
ставишь ее после проксевой мидлвари и все
источник

s

serg in Scrapy
привет!
Поделитесь, пожалуйста, примером скачивания большого файла кусками используя scrapy

Суть задачи: скачать файл с сайта с авторизацией из-за которой проблематично использовать requests
источник

s

serg in Scrapy
url  для скачивания распарсить удалось, полностью скачать файл тоже не проблема: f.write(response.body)


вот вопрос как этот response.body вытащить по кусочкам
источник

МС

Михаил Синегубов... in Scrapy
эээ, обычно авторизацию проще пройти реквестами....
источник

МС

Михаил Синегубов... in Scrapy
файл единичный или из 100500 штук?
источник

s

serg in Scrapy
единичный
источник

МС

Михаил Синегубов... in Scrapy
тогда однозначно реквесты
источник

МС

Михаил Синегубов... in Scrapy
источник

G

Georgiy in Scrapy
какого размера файл? и почему его нужно скачать именно по кусочкам?
источник

s

serg in Scrapy
хм, спасибо, понятно, а тогда следующий вопрос:
как передать куки авторизации для requests? 😅
В scrapy удобно передать только логин и пароль и не заморачиваться насчет ручной установки кук и переадресаций.
источник

s

serg in Scrapy
от 40 до 300 мб - для визуального отображения процесса юзеру
источник

МС

Михаил Синегубов... in Scrapy
session
источник

G

Georgiy in Scrapy
и для первого и для второго в scrapy уже есть пулл реквесты:
Stream response body for large files -> https://github.com/scrapy/scrapy/pull/5044
Progress bar for large downloads https://github.com/scrapy/scrapy/pull/5042
источник

s

serg in Scrapy
это хорошо конечно
источник

s

serg in Scrapy
а можно как то автоматически передать куки который получил в итоге scrapy в requests?
источник

МС

Михаил Синегубов... in Scrapy
можно, но и, сессии то и куки держат, насколько я понимаю, нафига франкенштейна городить?
источник