Size: a a a

2021 April 23

П

Пастырь in Scrapy
Объясни задачу, может помогу
источник

BL

Boris Litvyakov in Scrapy
а разве есть открытые и качественные геокодеры? я как-то раз 500к адресов прогонял через openstreetmap, добился тип 95% результата по Москве (после долгих танцев с бубном), по России хуже было

для России норм зашла dadata но там 0.1₽/запрос
источник

S

SoHard 🎄 in Scrapy
ввести фирму в поиск, собрать каждого результата координаты, сайт, плюскод
источник

П

Пастырь in Scrapy
А если 2гис? Там свободно данные отдаются
источник

П

Пастырь in Scrapy
Есть, у меня 99% пробовало
источник

П

Пастырь in Scrapy
Даже регионы, я в нем живу :)
источник

П

Пастырь in Scrapy
Welcome to GeoPy’s documentation! — GeoPy 2.1.0 documentation
https://geopy.readthedocs.io/en/stable/#module-geopy.geocoders
источник

П

Пастырь in Scrapy
Вот этой либо пользовался. Номинализм справляется, правда медленный достаточно
источник

М

Максим in Scrapy
Подскажите пожалуйста, как сделать так чтобы в скрапи выполнялся запрос на страничку до тех пор, пока не получит нужный ответ(долбить одну и ту же страничку проще говоря)?

Знаю, что можно банить прокси задав нужную логику в response_is_ban. Есть что-то подобное для моего случая, но не баня прокси?
источник

AR

Andrey Rahmatullin in Scrapy
RETRY_TIMES=10000000000000
источник

AR

Andrey Rahmatullin in Scrapy
толку-то
источник

М

Максим in Scrapy
Нет, не то.
Как мне задать политику, при которой страничка должна заново загружаться? Ответ то всегда 200, но контент разный
источник

AR

Andrey Rahmatullin in Scrapy
написать мидлварь
источник

М

Максим in Scrapy
Слышал, что есть retry_policy, но не нашел
источник

AR

Andrey Rahmatullin in Scrapy
или ещё проще, прямо в колбэке проверку и заново отправку
источник

AR

Andrey Rahmatullin in Scrapy
код RetryMiddleware доступен, ничего такого там нет
источник

М

Максим in Scrapy
Нашел решение, похожее на твое, но только надо не заново делать запрос, а кидать исключение ResponseFailed
источник

М

Максим in Scrapy
тогда он будет пытаться заново сделать запрос
источник

AR

Andrey Rahmatullin in Scrapy
откуда кидать? из колбэка?
источник

М

Максим in Scrapy
Да
источник