Size: a a a

2020 November 23

И

Илья in Scrapy
Это просто какие то странные двойные кавычки
источник

S

SoHard 🎄 in Scrapy
Илья
Это просто какие то странные двойные кавычки
Это просто json
источник

A

Andrii in Scrapy
http://www2.rio.rj.gov.br/multas/index.asp - как достать картинку капчи?)
источник
2020 November 24

И

Илья in Scrapy
Как мне проверить работоспособность ссылки внутри паука? К примеру если ответ 200, то идём дальше, если 404 то заканчиваем.
источник

B

Bulatbulat48 in Scrapy
Илья
Как мне проверить работоспособность ссылки внутри паука? К примеру если ответ 200, то идём дальше, если 404 то заканчиваем.
response.status
источник

И

Илья in Scrapy
Это текущей ссылки. А если у меня просто урл есть
источник

К

Кирилл in Scrapy
Илья
Это текущей ссылки. А если у меня просто урл есть
Его нужно запросить сначала, чтоб что-то узнать
источник

И

Илья in Scrapy
как его запросить ?
источник

AR

Andrey Rahmatullin in Scrapy
как обычно скрапи запрашивает страницы лол
источник

AR

Andrey Rahmatullin in Scrapy
реквестом с коллбэком
источник

B

Bulatbulat48 in Scrapy
свангую что нужен @inline_requests
источник

AR

Andrey Rahmatullin in Scrapy
или логику перепродумать
источник

МС

Михаил Синегубов... in Scrapy
Илья
как его запросить ?
как говорил мэтр Матроскин "Что бы продать что то не нужное, надо сначала купить что то не нужное"©.

что бы получить ответ, надо его запросить. И да, скрапи, по умолчанию, фильтрует все что "не 200".
источник

И

Илья in Scrapy
Написать метод который вернет respons.status и подсунуть его scrapy.Request(url, метод)?
источник

AR

Andrey Rahmatullin in Scrapy
нет
источник

B

Bulatbulat48 in Scrapy
Илья
Написать метод который вернет respons.status и подсунуть его scrapy.Request(url, метод)?
туториал смотрели? https://docs.scrapy.org/en/latest/intro/tutorial.html
или тут нужно что-то сложное?
источник

B

Bulatbulat48 in Scrapy
if response.status == 404:
   raise CloseSpider(‘404 error’)


обрабатывать в def parse  <— дефолтная функция колбека
источник

И

Илья in Scrapy
next_page = response.css('li.next a::attr(href)').get()
       if next_page is not None:
           yield response.follow(next_page, self.parse)
вот так в туториале, он просто проверяет кнопку на страничке. А если  у меня нет кнопок вообще. Автоподгрузка при скролле на странице стоит. Мне нужно знать есть ли следующая страница
источник

B

Bulatbulat48 in Scrapy
import scrapy


class QuotesSpider(scrapy.Spider):
   name = "quotes"
   start_urls = [
       'http://quotes.toscrape.com/page/1/',
       'http://quotes.toscrape.com/page/2/',
   ]

   def parse(self, response):
       if response.status == 404:
           raise CloseSpider(‘404 error’)
источник

И

Илья in Scrapy
Bulatbulat48
import scrapy


class QuotesSpider(scrapy.Spider):
   name = "quotes"
   start_urls = [
       'http://quotes.toscrape.com/page/1/',
       'http://quotes.toscrape.com/page/2/',
   ]

   def parse(self, response):
       if response.status == 404:
           raise CloseSpider(‘404 error’)
понял, спасибо
источник