Size: a a a

2019 June 30

JW

John Wayne in Scrapy
Люди подскажите, а как грамотно и красиво в скрапи реализуется, запоминание места где был прерван парсинг, чтобы продолжить с того же места?
источник

DD

Danil Denysenko in Scrapy
John Wayne
Люди подскажите, а как грамотно и красиво в скрапи реализуется, запоминание места где был прерван парсинг, чтобы продолжить с того же места?
Я думаю, что это реализуется в базе данных. Типо добавляешь колонку со значениями тру или фалс и все
источник

S

S.B.A in Scrapy
xor
смотря что хочешь, если разово то bs за глаза
Можно подробнее?
источник

x

xor in Scrapy
S.B.A
Можно подробнее?
что?
источник

S

S.B.A in Scrapy
Что за разово?
источник

S

S.B.A in Scrapy
Просто вывести данные за раз?
источник

Y

Yurii in Scrapy
Можно за два раза вывести😄
источник

JW

John Wayne in Scrapy
Danil Denysenko
Я думаю, что это реализуется в базе данных. Типо добавляешь колонку со значениями тру или фалс и все
А мб есть у кого, ссылка на красивую реализацию, чтобы велик франкенштейна не собирать.
источник

M

Mohamad in Scrapy
Почему запрос в скрапи с прокси такой медленный? Пинг всего лишь 100 у проксей, и 3 запроса секунд 20 делает. Без них за пару секунд.
источник

s

serhii in Scrapy
а что за прокси?
источник

s

serhii in Scrapy
где покупал?
источник

s

serhii in Scrapy
краулера, например, от плана зависит, самый дешевый медленный.
источник

M

Mohamad in Scrapy
serhii
а что за прокси?
fine
источник

M

Mohamad in Scrapy
serhii
краулера, например, от плана зависит, самый дешевый медленный.
файн обычные, пинг 100-150 максимум
источник

AS

Alexander Serebrov in Scrapy
Mohamad
запрос делает - парсит - делает что-то секунды 3 - и опять запрос  И НЕ  ПОНЯТНО ОТКУДА ЭТИ 3 СЕКУНДЫ??
В сеттингс есть auto_throttling - попробуй его отключить :) по умолчанию скрейпи менеджит делеи между реквестами чтобы не перегружать сайты, которые ты парсишь
источник

AS

Alexander Serebrov in Scrapy
источник

AS

Alexander Serebrov in Scrapy
И остальное попробуй
источник

i

ildar in Scrapy
John Wayne
А мб есть у кого, ссылка на красивую реализацию, чтобы велик франкенштейна не собирать.
посмотри, для начала, здесь, кажется, это как раз то, что тебе нужно: https://docs.scrapy.org/en/latest/topics/jobs.html
источник

i

ildar in Scrapy
Mohamad
запрос делает - парсит - делает что-то секунды 3 - и опять запрос  И НЕ  ПОНЯТНО ОТКУДА ЭТИ 3 СЕКУНДЫ??
это не нормально, может у тебя в сеттингсах там к примеру delay стоит, поищи еще sleep по коду. и все слова delay
источник

i

ildar in Scrapy
можно еще в консоли выполнить scrapy bench, чтобы проверить свое оборудование, сколько в идеальных условиях скрапи может выжать из себя, он создаст простой сервер на локальном компе и будет оттуда тянуть данные, правда лично у меня оно почему-то дохнет со словами о том, что не может подключиться к этому серверу, хех)
источник