Size: a a a

2020 April 16

VB

Vladyslav Babych in Scrapy
Или их всегда будет 16 + пулл?
источник

AR

Andrey Rahmatullin in Scrapy
со скрапи или со своим скриптом?
источник

VB

Vladyslav Babych in Scrapy
Andrey Rahmatullin
со скрапи или со своим скриптом?
скрапи
источник

AR

Andrey Rahmatullin in Scrapy
да сколько можно
источник

AR

Andrey Rahmatullin in Scrapy
в скрапи один поток
источник

VB

Vladyslav Babych in Scrapy
Вот я вообще не понимаю в чём я ошибаюсь. У меня на 1 запрос в среднем уходит 15 секунд. При идеальных условиях за минуту я должен с 1 рекурентным запросом получить 4 страницы, с 40 - 160  верно?  Но я получаю максимум 40
источник

VB

Vladyslav Babych in Scrapy
Это же не нормально?
источник

AR

Andrey Rahmatullin in Scrapy
убери всю постобработку
источник

VB

Vladyslav Babych in Scrapy
Без неё
источник

AR

Andrey Rahmatullin in Scrapy
и покажи Overridden settings: строчку
источник

AR

Andrey Rahmatullin in Scrapy
ну, CONCURRENT_* оттуда хотя бы
источник

VB

Vladyslav Babych in Scrapy
Andrey Rahmatullin
и покажи Overridden settings: строчку
INFO:scrapy.crawler:Overridden settings:
{'BOT_NAME': 'asin_parse',
'CONCURRENT_REQUESTS': 40,
'CONCURRENT_REQUESTS_PER_DOMAIN': 40,
'CONCURRENT_REQUESTS_PER_IP': 40,
'FEED_FORMAT': 'csv',
'HTTPCACHE_ENABLED': True,
'HTTPCACHE_EXPIRATION_SECS': 864000,
'HTTPCACHE_STORAGE': 'scrapy.extensions.httpcache.DbmCacheStorage',
'LOG_FILE': 'log.log',
'LOG_LEVEL': 'ERROR',
'NEWSPIDER_MODULE': 'amz_services.services.get_items_front.asin_parse.spiders',
'REACTOR_THREADPOOL_MAXSIZE': 100,
'SPIDER_MODULES': ['amz_services.services.get_items_front.asin_parse.spiders'],
'TELNETCONSOLE_PASSWORD': 'hy98Mh8D',
'TELNETCONSOLE_USERNAME': 'pydev'}
источник

AR

Andrey Rahmatullin in Scrapy
а прокси?
источник

VB

Vladyslav Babych in Scrapy
нет
источник

AR

Andrey Rahmatullin in Scrapy
скрапить амазон с одного ипа?
источник

VB

Vladyslav Babych in Scrapy
Я получаю хтмл уже
источник

VB

Vladyslav Babych in Scrapy
В любом случае не в этом дело
источник

AR

Andrey Rahmatullin in Scrapy
почему?
источник

VB

Vladyslav Babych in Scrapy
Я через scraperapi.com
источник

AR

Andrey Rahmatullin in Scrapy
и ты среднее время на запрос как считал?
источник