Телеграмм чат группы scrapy

обьясните мне тупому КАК ЭТО РАБОТАЕТ
Я хочу сохранять куки в файл.
У меня включен cookie debug, и в логах показывается какие куки отправляются. Я подумал - ну ок, всё просто смотрим в исходный код библиотеки, как там это делается и повторяем.
Посмотрел, используеться request.headers.getlist('Cookie')
Думаю супер - решено, пишу это в свой код, и решил для начала сделать просто print.
В итоге в логах почему то все куки показывается(csrf, token, phpssesid, identity)
А в принте
print(request.headers.getlist('Cookie'))

выводит только identity

источник

15:49пожаловаться #11

C

Come Back in Scrapy

Python

Нужно исправить ошибку в моем скрипте по парсингу данных из одного сайта

Код небольшой (примерно 100 строчек)

Цена: договорная

Пишите в лс, если кто-то заинтересован

источник

16:59пожаловаться #12

S

SoHard 🎄 in Scrapy

Come Back

Python

Нужно исправить ошибку в моем скрипте по парсингу данных из одного сайта

Код небольшой (примерно 100 строчек)

Цена: договорная

Пишите в лс, если кто-то заинтересован

1. http://t.me/scrapy_jobs
2. ошибка понятие растяжимое

источник

17:01пожаловаться #13

AV

Anatoli Valenda in Scrapy

Всем привет. Помогите. Нагуглить ответ не смог. Есть n категорий. В зависимости от категории формируется request и передаёт данные в callback функцию, где из response формируются items. Количество items заранее не известно. Как сообщить из callback функции, что данные в response закончились и что пора менять категорию в request? Паук тянет json через api.

источник

18:34пожаловаться #14

AV

Anatoli Valenda in Scrapy

Про что почитать хотя бы подскажите.

источник

18:35пожаловаться #15

К

Кирилл in Scrapy

Anatoli Valenda

Всем привет. Помогите. Нагуглить ответ не смог. Есть n категорий. В зависимости от категории формируется request и передаёт данные в callback функцию, где из response формируются items. Количество items заранее не известно. Как сообщить из callback функции, что данные в response закончились и что пора менять категорию в request? Паук тянет json через api.

Запрашивай сразу все категории

источник

18:41пожаловаться #16

AV

Anatoli Valenda in Scrapy

Кирилл

Запрашивай сразу все категории

Но я ведь не знаю количество запросов, которые мне нужно сформировать. Как мне передать команду, что нужно остановить формирование запросов т.к. данных большее нет?

источник

18:59пожаловаться #17

К

Кирилл in Scrapy

Anatoli Valenda

Но я ведь не знаю количество запросов, которые мне нужно сформировать. Как мне передать команду, что нужно остановить формирование запросов т.к. данных большее нет?

Ты сразу в цикле все запросы с категориями сформируй и иельдь их, не нужно из калбэков этим управлять

источник

19:01пожаловаться #18

К

Кирилл in Scrapy

Anatoli Valenda

Но я ведь не знаю количество запросов, которые мне нужно сформировать. Как мне передать команду, что нужно остановить формирование запросов т.к. данных большее нет?

Можешь ещё этот сигнал посмотреть, может быть это то что ты спрашивал https://docs.scrapy.org/en/latest/topics/signals.html?highlight=on_idle#std-signal-spider_idle

Но я думаю что он скорее всего не нужен тут

источник

19:04пожаловаться #19

AR

Andrey Rahmatullin in Scrapy

Anatoli Valenda

Но я ведь не знаю количество запросов, которые мне нужно сформировать. Как мне передать команду, что нужно остановить формирование запросов т.к. данных большее нет?

запрашивай следующую страницу из колбэка предыдущей, а не сразу все

источник

19:15пожаловаться #20