Size: a a a

2019 August 06

М

Мак in Scrapy
с ходу появляется мысль, что можно таймаут установить и перехватывать исключение по таймауту... но это ж придется свой мидлварь писать
источник

М

Мак in Scrapy
вот думаю может уже есть какое то решение все таки
источник

E

Evgen in Scrapy
у сплэша в любом случае есть таймаут по умолчанию. это вроде 30 сек но я не помню
источник

E

Evgen in Scrapy
скорее всего вам надо будет переопределить какой нибудь retryMiddleware или splashMiddleware я не уверен
источник

E

Evgen in Scrapy
чтобы он после 504 в splash.args проксю менял
источник

E

Evgen in Scrapy
и не сплэш ломится в локальный докер, и тот проксю берет, а scrapy через splash middleware ломится на адрес splash в настройках. И если у вас splash в докере то вы в самом докере порт пробрасываете на локалхост, так-что для scrapy все выглядит, что splash просто на локалхосте запущен
источник

М

Мак in Scrapy
Evgen
и не сплэш ломится в локальный докер, и тот проксю берет, а scrapy через splash middleware ломится на адрес splash в настройках. И если у вас splash в докере то вы в самом докере порт пробрасываете на локалхост, так-что для scrapy все выглядит, что splash просто на локалхосте запущен
ну, я криво выразился просто
источник

М

Мак in Scrapy
основной смысл - как обеспечить ротацию прокси при использовании сплеш
источник

E

Evgen in Scrapy
ну я же сказал, splash при недоступности прокси будет отдавать вам 504 или 502 (надо тестить и проверять), а scrapy собственно через RetryMiddleware будет этот реквест повторять. Вам надо переопределить Retrymiddlware и заменить у реквеста splash.args.proxy
источник

М

Мак in Scrapy
нда... 504 Gateway Time-out...
источник

i

ildar in Scrapy
Алексей Нагорский
Рекурсивную что ли какую-то сделать, что бы запрос, меняющий месяц и год коллбэкнул опять эту функцию
Ты можешь проверять и коллбекать эту же функцию
источник

АН

Алексей Нагорский in Scrapy
ildar
Ты можешь проверять и коллбекать эту же функцию
Сделал все таки с inline_requests, гори оно огнем пока со всем остальным не разберусь))
источник

i

ildar in Scrapy
Алексей Нагорский
Сделал все таки с inline_requests, гори оно огнем пока со всем остальным не разберусь))
Ну суть в том, что тебе все равно надо делать проверку, в любом случае, просто в этом случае делаешь коллбек этой же функции, если параметры даты не совпадают, передавая правильные , может быть с don't filter, а если все клево, обрабатываешь стандартно
источник

МС

Михаил Синегубов in Scrapy
ildar
Ну суть в том, что тебе все равно надо делать проверку, в любом случае, просто в этом случае делаешь коллбек этой же функции, если параметры даты не совпадают, передавая правильные , может быть с don't filter, а если все клево, обрабатываешь стандартно
там более запущенно, там надо перебрать диапазон дат.... :)
источник

E

Evgen in Scrapy
прикольный апдейт в scrapy 1.7: https://docs.scrapy.org/en/latest/topics/request-response.html#scrapy.http.Request.cb_kwargs
Теперь можно аргументы в callback отправлять вместо meta
источник

МС

Михаил Синегубов in Scrapy
ухтыжка, это жеж можно айтемы не таскать....
хотя - один хрен 🤔
источник

i

ildar in Scrapy
Михаил Синегубов
там более запущенно, там надо перебрать диапазон дат.... :)
Ну я пока трудностей не вижу, либо строчка с inline, либо yield
источник

МС

Михаил Синегубов in Scrapy
ildar
Ну я пока трудностей не вижу, либо строчка с inline, либо yield
ну, учитывая что там тормозной ASP + вообще как то криво он работает....
Леха так и сказал "пока с остальным не разберусь", а разбираться там есть еще с чем :)
источник

i

ildar in Scrapy
Разве что там начнутся  какие-нибудь гонки
источник

i

ildar in Scrapy
Ну так то да, главно шо работает, и код не особо им еняется
источник