Size: a a a

2019 July 03

МС

Михаил Синегубов in Scrapy
вообще, основы прохода защит примитивных на офф сайте есть :)
источник

I

Ivan in Scrapy
вчера забирал нормально, сегодня уже не отдает ничего
источник

Y

Yurii in Scrapy
Скопируй хедер из браузера и воткни в скрапи
источник

I

Ivan in Scrapy
Yurii
Скопируй хедер из браузера и воткни в скрапи
я использую scrapy_user_agents
источник

I

Ivan in Scrapy
через requests ответ приходит
источник

Y

Yurii in Scrapy
DEFAULT_REQUEST_HEADERS
источник

I

Ivan in Scrapy
4 сайта из 5 норм парсятся
источник

I

Ivan in Scrapy
я вот доделал 5 парсеров и сижу понимаю что их можно было за один день сделать а не за неделю
источник

s

serhii in Scrapy
Ivan
я вот доделал 5 парсеров и сижу понимаю что их можно было за один день сделать а не за неделю
Сделаешь за день, скажешь, что можно было бы за три часа
источник

s

serhii in Scrapy
serhii
Сделаешь за день, скажешь, что можно было бы за три часа
Совершенству нет предела
источник

Y

Yurii in Scrapy
Смотря какой сайт и какие требования
источник

I

Ivan in Scrapy
ну я первый раз на скрапи делал
источник

AM

Alexey Markovski in Scrapy
Парни, как парсить сайты, в которых надо логиниться? При запросах пакеты какие-то отправлять7
источник

B

Bulatbulat48 in Scrapy
Alexey Markovski
Парни, как парсить сайты, в которых надо логиниться? При запросах пакеты какие-то отправлять7
FormRequest чаще всего
источник

s

serhii in Scrapy
Алексей Нагорский
Как-то получилось, надо только капчу как-то вывести для решения и надеюсь что все таки получится получить урл до эксельника
Поборол капчу?
источник

АН

Алексей Нагорский in Scrapy
serhii
Поборол капчу?
Пока просто вывожу урл и жду ответа в input() :)
источник

АН

Алексей Нагорский in Scrapy
serhii
Поборол капчу?
У тебя с request получилось?
источник

PA

Phantom Assasin in Scrapy
Yurii
От платных прокси смысл небольшой особенно если в больших количествах. Мб и есть хорошие сервисы. А так дофига забанено. А небольшие сайты можно и халявными покачать тк скорость не столь важна. Без большого количества заказов по крупным сайтам смысл прокси покупать сомнителен.
я каждый проверяю 👁 если есть проблемы мне его меняют 👲🏼
ну у меня объем меленький 20 - 40 штук
источник

s

serhii in Scrapy
наксколько я понимаю, работая с одним сайтом, состояние прохождения капчи привязывается к айпи.
ибо посылаю курлом - не отвечает, решаю капчу на сайте и посылаю тем же самым курлом - получаю ответ.
правильна ли моя мысль? а то впервые борюсь с капчей =)
источник

МС

Михаил Синегубов in Scrapy
в целом да, только надо не забывать о captcha_id/session_id или что то вроде того. Когда ответ капти отправляется на сервак, где-то должен быть идентификатор, что бы потом понять, к какой каптче ответ проверяется
источник