Телеграмм чат группы scrapy

да нет, очень простой парсер. Все эти глюки наблюдаю после переезда на хецнер облако. Походу буду менять на что-то другое. Но вот сейчас обновил openssl до версии 1.1.1 и пока подобных ошибок не наблюдаю

источник

18:20пожаловаться #9

RG

Roman Gangal in Scrapy

Подскажите, есть ли готовые скрипты чтоб сделать свой отдельный ротатор проксей по типу как у Crawlera? Чтоб указывать в парсере только один адрес типа http://proxy.crawlera.com:8010 и при каждом запросе дергалась рандомная прокся. У меня есть список своих проксей, пробовал брать с файла и с базы, но вот удаленный ротатор это то что нужно, и очень удобно. Хотя бы посоветуйте в какую сторону копать?

источник

18:25пожаловаться #10

R

Roma in Scrapy

Переслано от Михаил Синегубов

https://github.com/TeamHG-Memex/scrapy-rotating-proxies/blob/master/rotating_proxies/middlewares.py
строки

посмотри как тут логи прикручены. Он каждый 30 сек плюет INFO в лог

GitHub

TeamHG-Memex/scrapy-rotating-proxies

use multiple proxies with Scrapy. Contribute to TeamHG-Memex/scrapy-rotating-proxies development by creating an account on GitHub.

источник

18:27пожаловаться #11

К

Кирилл in Scrapy

самих ротаторов не встречал, но если что-то простенькое, то несложно и написать

источник

18:28пожаловаться #12

iz

izzz zzi in Scrapy

Roman Gangal

Подскажите, есть ли готовые скрипты чтоб сделать свой отдельный ротатор проксей по типу как у Crawlera? Чтоб указывать в парсере только один адрес типа http://proxy.crawlera.com:8010 и при каждом запросе дергалась рандомная прокся. У меня есть список своих проксей, пробовал брать с файла и с базы, но вот удаленный ротатор это то что нужно, и очень удобно. Хотя бы посоветуйте в какую сторону копать?

Что бы на вход была одна прокся тебе нужно понять все это

источник

18:28пожаловаться #13

R

Roma in Scrapy

А разве этот scrapy-rotating-proxies - работает не по этому принципу?

источник

18:31пожаловаться #14

К

Кирилл in Scrapy

по этому, взять принцип, и вынести в отдельный сервис с api

источник

18:31пожаловаться #15

R

Roma in Scrapy

Да я им не пользуюсь - очень уж медленный

источник

18:31пожаловаться #16

R

Roma in Scrapy

свое написано

источник

18:32пожаловаться #17

К

Кирилл in Scrapy

там рандом забит, поэтому медленный, только с низким числом прокси будет норм

источник

18:32пожаловаться #18

RG

Roman Gangal in Scrapy

В чем может быть причина такой ошибки [scrapy.core.downloader.handlers.http11] WARNING: Got data loss in https://site.com. If you want to process broken responses set the setting DOWNLOAD_FAIL_ON_DATALOSS = False -- This message won't be shown in further requests

Хотя урл при тестах нормально открывается

источник

20:42пожаловаться #19

AR

Andrey Rahmatullin in Scrapy

соединение оборвалось при передаче страницы

источник

20:45пожаловаться #20