Size: a a a

2019 August 15

К

Кирилл in Scrapy
For example, if you set CONCURRENT_REQUESTS_PER_DOMAIN=2 then spider will be making at most 2 concurrent connections to each proxy, regardless of request url domain.
источник

К

Кирилл in Scrapy
написано to each но вроде это неправда
источник
2019 August 16

МС

Михаил Синегубов in Scrapy
izzz zzi
нет , пока созраняю самое гео в json от медиа
слух, ты инсту через проксю парсишь?
просто у меня скарпи внезапно отказался через проксю инсту прасить.... отдает 502 ошибку.
через рексвест - все Ок....
источник

МС

Михаил Синегубов in Scrapy
кстати, народ, у кого есть хорошая (не халявная) прокся с незакрытой инстой?
я своего паучка брошу - тестанете.
а то ппц какой-то, на прошлой неделе работало. Щас написал чекер акков. Хотел данные спарсить старым пауком - и тут болт.
Причем сейчас попробовал вообще древнего паука - не работает через проксю.... На прямую все Ок.
источник

A

AstralRomance in Scrapy
Ставлю я анаконду. Делаю я анакондой венв, активирую его, потом ставлю скрапю.
conda install -c conda-forge scrapy

Хочу я такой сделать павука, а оно мне такое какое на скрине. Уже правда есть мысль попробовать через pip накатить скрапю в обычный питон. Какие подводные?
источник

МС

Михаил Синегубов in Scrapy
что выдает, если просто ввести "scrapy"
источник

МС

Михаил Синегубов in Scrapy
?
источник

A

AstralRomance in Scrapy
А я уже все снес, поставил в обычный питон и все решило заработать.
источник

DD

Danil Denysenko in Scrapy
))
источник

s

serhii in Scrapy
На винде виртуальное окружение не работает что-ли?
источник

s

serhii in Scrapy
AstralRomance
Ставлю я анаконду. Делаю я анакондой венв, активирую его, потом ставлю скрапю.
conda install -c conda-forge scrapy

Хочу я такой сделать павука, а оно мне такое какое на скрине. Уже правда есть мысль попробовать через pip накатить скрапю в обычный питон. Какие подводные?
У тебя 32 битная винда?
источник

A

AstralRomance in Scrapy
serhii
У тебя 32 битная винда?
64.
источник

К

Кирилл in Scrapy
Кирилл
кто-то пользуется? https://github.com/TeamHG-Memex/scrapy-rotating-proxies

интересует задержка между запросами и число конкурентных запросов, в доке написано что оно на каждую проксю отдельно действует, но я меняю число прокси, а количество итемов в минуту примерно одинаковое, такое ощущение что задержка общая
Если кому вдруг интересно, после чтения исходников выяснилось, что настройки:

CONCURRENT_REQUESTS_PER_DOMAIN
CONCURRENT_REQUESTS_PER_IP
DOWNLOAD_DELAY
работают на каждую проксю отдельно, но CONCURRENT_REQUESTS_PER_IP не будет привязан к ip и сработает так же как  и CONCURRENT_REQUESTS_PER_DOMAIN, разницы нет

CONCURRENT_REQUESTS ставит ограничение на всё вместе, а не на каждую проксю
источник

iz

izzz zzi in Scrapy
Михаил Синегубов
слух, ты инсту через проксю парсишь?
просто у меня скарпи внезапно отказался через проксю инсту прасить.... отдает 502 ошибку.
через рексвест - все Ок....
Да через прокси
источник

МС

Михаил Синегубов in Scrapy
izzz zzi
Да через прокси
чья прокся? в смысле, где брал
источник

iz

izzz zzi in Scrapy
Михаил Синегубов
чья прокся? в смысле, где брал
Ты можешь и ipv6 взять они же дешевые , я брал на proxy.house
источник

МС

Михаил Синегубов in Scrapy
блин, у меня какой-то маразм... Через реквест работает, скрапи - нихрена....
буду завтра пинать
источник

МС

Михаил Синегубов in Scrapy
первый раз такое
источник

iz

izzz zzi in Scrapy
Хедер мб ?
источник

МС

Михаил Синегубов in Scrapy
izzz zzi
Хедер мб ?
если выключить проксю - всре работает
источник