Ребят, подскажите вот если возвращается в скрапи 200 ответ, но страница с капчей. Как ее обратно отправить на парсинг?
1. без проксей ИМХО, ловить тут нехрен 2. https://github.com/TeamHG-Memex/scrapy-rotating-proxies - этот умеет детектить баны по телу страницы (считаем, что каптча=бан). Только надо покрутить приоритеты мидлварей, что бы текст страницы стал текстом. То дефолту - там косячек
У меня есть рула Rule(LinkExtractor(allow=r'.*'), callback='parse_item', follow=True), т.е мне обойти весь сайт надо, и вот я хочу чтобы в коллбек приходил результат от селениума
" This callable should take said request as first argument and the Response from which the request originated as second argument." очень похоже на то что тогда 2 раза придётся запрос делать
окей, если не через Rule, надо тогда просто руками написать обход того что вернёт LinkExtractor, так получается? Обход имею ввиду послать запросы от селениума
" This callable should take said request as first argument and the Response from which the request originated as second argument." очень похоже на то что тогда 2 раза придётся запрос делать