Size: a a a

2020 April 16

B

Bulatbulat48 in Scrapy
а в самописном какой юзер агент?
источник

B

Bulatbulat48 in Scrapy
Vladyslav Babych
Ещё я начал получать иногда такую ошибку, может ли она быть связана с работаю твистеда, или чего-то подобногоtook longer than 180.0 seconds..
вот собственно вместо бана, тебе сайт отдает.
источник

B

Bulatbulat48 in Scrapy
нужно чаще менять проксю как вариант
источник

VB

Vladyslav Babych in Scrapy
Bulatbulat48
вот собственно вместо бана, тебе сайт отдает.
Это очень редко попадалось и скорее всего из-за моего интернета
источник

B

Bulatbulat48 in Scrapy
так у тебя же через прокси сервис?
источник

VB

Vladyslav Babych in Scrapy
Bulatbulat48
так у тебя же через прокси сервис?
Он их сам меняет подставляет и тд
источник

B

Bulatbulat48 in Scrapy
сайт получает запрос => в заголовке бот (либо другие признаки) => держи задержку в 50-150 секунд. Устраивает, парси.
источник

AR

Andrey Rahmatullin in Scrapy
Он считает что наблюдаемая задержка не соответствует наблюдаемому рпм при имеющихся настройках, как я понял
источник

B

Bulatbulat48 in Scrapy
@Molfar_Page ну имхо самый простой вариант натравить скрапи и самописный скрипт на простейщий сайт. И понять в чем дело.
источник

B

Bulatbulat48 in Scrapy
Andrey Rahmatullin
Он считает что наблюдаемая задержка не соответствует наблюдаемому рпм при имеющихся настройках, как я понял
хм, такое может быть? 🤔
источник

AR

Andrey Rahmatullin in Scrapy
мы это и пытаемся выяснить, похоже
источник

B

Bulatbulat48 in Scrapy
😅
источник
2020 April 17

K

Kid in Scrapy
Добрый вечер. Подскажите ресурс, где можно найти пример кода с парсингом страниц с вложенными страницами) Ну или ваш пример на гитхабе
источник

Q

Qwelcer in Scrapy
Kid
Добрый вечер. Подскажите ресурс, где можно найти пример кода с парсингом страниц с вложенными страницами) Ну или ваш пример на гитхабе
оф документацию Скрапи открой, там есть примеры кода)
источник

K

Kid in Scrapy
Qwelcer
оф документацию Скрапи открой, там есть примеры кода)
спасибо, посмотрю
источник

AC

Alexander Chaptykov in Scrapy
Всем привет! А как можно запустить спайдер с кастомными ITEM_PIPELINES?
вот например можно запустить
scrapy crawl simple -s ITEM_PIPELINES=\{\}
И тогда ITEM_PIPELINES будут пустые,  а как добавить значения свои в ITEM_PIPELINES?
источник

СТ

Семён Трояновский in Scrapy
Alexander Chaptykov
Всем привет! А как можно запустить спайдер с кастомными ITEM_PIPELINES?
вот например можно запустить
scrapy crawl simple -s ITEM_PIPELINES=\{\}
И тогда ITEM_PIPELINES будут пустые,  а как добавить значения свои в ITEM_PIPELINES?
я прям в самом спайдере прописывал, там можно указать custom settings для отдельного паука
источник

AC

Alexander Chaptykov in Scrapy
да но мне хочется каждый раз по своему настраивать запуск
источник

СТ

Семён Трояновский in Scrapy
Alexander Chaptykov
да но мне хочется каждый раз по своему настраивать запуск
про такое не в курсе )
источник

М

Мак in Scrapy
Напиши несколько классов разных пайпов и включай их в кастом сеттингс по необходимости
источник