Телеграмм чат группы scrapy_python страница 1257

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Scrapy

418 membersпожаловаться на группу

2020 March 16

MV

Maksim Vladimirovich in Scrapy

Vladyslav Babych

Привет, мне нужно запоминать индекс нахождения на странице. При этом я хожу поочерёдно по страницам, соответственно на каждую страницу запускается новый метод parse c помощью inline request. Как мне можно между разными запусками parse передать уже спаршенное колличество элементов. Что-бы счётчик не начинался на каждой старнице сначала?

Переменную как глобальную объявить?

источник

15:06пожаловаться #1

МС

Михаил Синегубов in Scrapy

Maksim Vladimirovich

Переменную как глобальную объявить?

в пределах паука? или что?
и назначение этой переменной какое?

источник

15:12пожаловаться #2

К

Кирилл in Scrapy

Не нужна там переменная и индекс этот. Просто flow нормальный сделать

источник

15:13пожаловаться #3

S

Sergey in Scrapy

На польскую прокси перестал капчей плеваться

источник

15:45пожаловаться #4

S

Sergey in Scrapy

но зараза медленно, если таймаут меньше 5 секунд или всегда одинаковый снова капча. поэтому поставил таймаут рандомный от 6 до 10 секунд

источник

15:47пожаловаться #5

К

Кирилл in Scrapy

DOWNLOAD_DELAY и так разброс делает рандомный

источник

15:48пожаловаться #6

К

Кирилл in Scrapy

интересно как ты фикс делай сделал

источник

15:48пожаловаться #7

S

Sergey in Scrapy

я sleep ом делай делал). Вот доку почитал, поставил через DOWNLOAD_DELAY )))

источник

15:49пожаловаться #8

S

Snoop Duck in Scrapy

Сейчас изучаю модуль scrapy-rotating-proxies. Поставил настройку ROTATING_PROXY_CLOSE_SPIDER=True, чтобы спайдер закрывался при истощении всех прокси. Попробовал потестить: исключение CloseSpider появляется, но спайдер не завершается, а продолжает работать, генерируя CloseSpider для каждого следующего запроса. Кто-нибудь знает, как заставить спайдер остановиться? Насколько я знаю, CloseSpider завершает работу спайдера только при непосредственном вызове из коллбэка, а здесь исключение генерируется внутри миддлвара

источник

16:10пожаловаться #9

RG

Roman Gangal in Scrapy

Snoop Duck

Сейчас изучаю модуль scrapy-rotating-proxies. Поставил настройку ROTATING_PROXY_CLOSE_SPIDER=True, чтобы спайдер закрывался при истощении всех прокси. Попробовал потестить: исключение CloseSpider появляется, но спайдер не завершается, а продолжает работать, генерируя CloseSpider для каждого следующего запроса. Кто-нибудь знает, как заставить спайдер остановиться? Насколько я знаю, CloseSpider завершает работу спайдера только при непосредственном вызове из коллбэка, а здесь исключение генерируется внутри миддлвара

Рекомендую следующую схему. Пишем сторонний скрипт который пишет список проксей в БД с регулярным обновлением если есть такая возможность. А в скрепи делаем мидвару которая с базы тянет рандомную проксю на каждый запрос. Вот тебе и ввесь рататор) при чем централизированный. Не нужно каждому боту свои файлики с проксями подсовывать. Все боты берут прокси с одной базы рандомно

источник

16:25пожаловаться #10

К

Кирилл in Scrapy

Рекомендую следующую схему. Пишем сторонний скрипт который пишет список проксей в БД с регулярным обновлением если есть такая возможность. А в скрепи делаем мидвару которая с базы тянет рандомную проксю на каждый запрос. Вот тебе и ввесь рататор) при чем централизированный. Не нужно каждому боту свои файлики с проксями подсовывать. Все боты берут прокси с одной базы рандомно

Уже написано такое

источник

16:35пожаловаться #11

RG

Roman Gangal in Scrapy

Уже написано такое

скинь урл, может поменяю свои костыли)

источник

16:41пожаловаться #12

К

Кирилл in Scrapy

скинь урл, может поменяю свои костыли)

вот с монгой есть https://github.com/xiaowangwindow/scrapy-rotated-proxy

xiaowangwindow/scrapy-rotated-proxy

A scrapy middleware to use rotated proxy ip list. Contribute to xiaowangwindow/scrapy-rotated-proxy development by creating an account on GitHub.

источник

16:42пожаловаться #13

RG

Roman Gangal in Scrapy

вот с монгой есть https://github.com/xiaowangwindow/scrapy-rotated-proxy

xiaowangwindow/scrapy-rotated-proxy

A scrapy middleware to use rotated proxy ip list. Contribute to xiaowangwindow/scrapy-rotated-proxy development by creating an account on GitHub.

спасибо!

источник

16:45пожаловаться #14

AK

Anil Kumar in Scrapy

How to download the same document multiple times using scrapy?

источник

16:56пожаловаться #15

К

Кирилл in Scrapy

yield scrapy.Request(response.url, dont_filter=True)

источник

16:57пожаловаться #16

AK

Anil Kumar in Scrapy

yield scrapy.Request(response.url, dont_filter=True)

I'm talking about files pipeline.

источник

16:59пожаловаться #17

AK

Anil Kumar in Scrapy

We can't download duplicates.

источник

16:59пожаловаться #18

AK

Anil Kumar in Scrapy

But I want to download duplicates

источник

16:59пожаловаться #19

К

Кирилл in Scrapy

so, do you want to override file?

источник

17:02пожаловаться #20