Телеграмм чат группы scrapy

как говорил мэтр Матроскин "Что бы продать что то не нужное, надо сначала купить что то не нужное"©.

что бы получить ответ, надо его запросить. И да, скрапи, по умолчанию, фильтрует все что "не 200".

источник

10:12пожаловаться #13

Илья in Scrapy

Написать метод который вернет respons.status и подсунуть его scrapy.Request(url, метод)?

источник

10:12пожаловаться #14

Andrey Rahmatullin in Scrapy

нет

источник

10:12пожаловаться #15

Bulatbulat48 in Scrapy

Илья

Написать метод который вернет respons.status и подсунуть его scrapy.Request(url, метод)?

туториал смотрели? https://docs.scrapy.org/en/latest/intro/tutorial.html
или тут нужно что-то сложное?

источник

10:14пожаловаться #16

Bulatbulat48 in Scrapy

if response.status == 404:
    raise CloseSpider(‘404 error’)

обрабатывать в def parse <— дефолтная функция колбека

источник

10:15пожаловаться #17

Илья in Scrapy

next_page = response.css('li.next a::attr(href)').get()
if next_page is not None:
yield response.follow(next_page, self.parse)
вот так в туториале, он просто проверяет кнопку на страничке. А если у меня нет кнопок вообще. Автоподгрузка при скролле на странице стоит. Мне нужно знать есть ли следующая страница

источник

10:16пожаловаться #18

Bulatbulat48 in Scrapy

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/page/1/',
        'http://quotes.toscrape.com/page/2/',
    ]

    def parse(self, response):
        if response.status == 404:
            raise CloseSpider(‘404 error’)

источник

10:17пожаловаться #19

Илья in Scrapy

Bulatbulat48

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/page/1/',
        'http://quotes.toscrape.com/page/2/',
    ]

    def parse(self, response):
        if response.status == 404:
            raise CloseSpider(‘404 error’)

понял, спасибо

источник

10:18пожаловаться #20