Size: a a a

2020 November 24

B

Bulatbulat48 in Scrapy
Илья
next_page = response.css('li.next a::attr(href)').get()
       if next_page is not None:
           yield response.follow(next_page, self.parse)
вот так в туториале, он просто проверяет кнопку на страничке. А если  у меня нет кнопок вообще. Автоподгрузка при скролле на странице стоит. Мне нужно знать есть ли следующая страница
если автоподгрузка, то это XHR нужно смотреть
источник

И

Илья in Scrapy
Да, я тоже заметил. Официальная документация. Видимо, чтобы понятнее было.
источник

AR

Andrey Rahmatullin in Scrapy
не то же, и вряд ли ругается
источник

S

SoHard 🎄 in Scrapy
Andrey Rahmatullin
не то же, и вряд ли ругается
Надо поробовать, может я попутал
источник

AR

Andrey Rahmatullin in Scrapy
не вижу смысла пробовать, bool(x) и x is Foo это явно разные вещи
источник
2020 November 25

KM

Konstantin Maiorov in Scrapy
Добрый день! Кто нибудь реализовывал свой бэкенд для хранения кэша?
Задача: хранить в body только нужный кусок кода, чтобы минимизировать расход места на диске.
Проблема: в метод store_response респонс приходит уже в байтовом виде и никаким образом не удается его корректно декодировать. Ни to_unicode ни body.decode корректно не декодируют, оригинал хотя в utf-8
источник

AR

Andrey Rahmatullin in Scrapy
Зачем декодировать, пиши байты на диск
источник

KM

Konstantin Maiorov in Scrapy
Чтобы весь сайт записать нужно очень много места. Я хочу только нужный кусок кода страницы хранить в кеше
источник

AR

Andrey Rahmatullin in Scrapy
А, тебе их процессить сначала
источник

KM

Konstantin Maiorov in Scrapy
Да
источник

AR

Andrey Rahmatullin in Scrapy
Тогда не понимаю что значит не получается декодировать
источник

KM

Konstantin Maiorov in Scrapy
Ну мне надо ведь где-то response обработать, а он приходит уже во всех методах в байтовом
источник

KM

Konstantin Maiorov in Scrapy
Или где я должен обрезать его
источник

KM

Konstantin Maiorov in Scrapy
Не в самом спайдере же
источник

KM

Konstantin Maiorov in Scrapy
В httpcache_middleware тоже в байтовом уже
источник

AR

Andrey Rahmatullin in Scrapy
я не понимаю что такое уже
источник

AR

Andrey Rahmatullin in Scrapy
респонс приходит туда как и всюду, обычный scrapy.http.Response, и разумеется он байтовый, как от сервера пришёл
источник

AR

Andrey Rahmatullin in Scrapy
(и разумеется его байтовость в колбэках людям проблем не доставляет)
источник

KM

Konstantin Maiorov in Scrapy
В коллбэках уже htmlresponse
источник

KM

Konstantin Maiorov in Scrapy
Там вообще проблем никаких нет
источник