Size: a a a

2021 May 31

AV

Anatoli Valenda in Scrapy
шикарно. Вебморда телеги не показала сообщение
источник

AV

Anatoli Valenda in Scrapy
ща попробую
источник

D

Dmitry in Scrapy
Ребят, такой вопрос - не совсем по парсингу, но близкий. В общем решил запилить себе VPN на VPS Hetzner (ради статичного IP) + думал поднимать временные инстансы Hetzner для парсинга (поднял-спарсил-выключил). В общем установил Wireguard на сервер, настроил клиента на компе, начал пользоваться и столкнулся с кучей блокировок разных даже при обычном веб-серфинге (даже не парсил еще ничего!).
источник

D

Dmitry in Scrapy
На абсолютно разных сайтах, которыми постоянно пользуюсь, начали выскакивать капчи Cloudfare, Hcaptca, Google Captcha. На том же Я.Маркете при обычном серфинге выскакивает капча через каждые 3-5 страниц - ну просто ппц.
источник

D

Dmitry in Scrapy
Пробовал поднимать новые инстансы ради получения нового IP, пробовал менять локации (их там 2 - Германия и Финляндия) - все одно и то-же. Первый запрос через браузер с нового инстанса на какой-нибудь Я.Маркет - сразу капча. Для интереса пробовал развернуть VPN на DigitalOcean - с блокировками не столкнулся.
источник

D

Dmitry in Scrapy
Собственно вопрос - как это работает? Я понимаю, что возможно кто-то поднимал инстанс для парсинга какого-то конкретного сайта - и соответствующий IP был бы заблокирован... Но чтобы сразу все сайты блочили конкретный IP!?
источник

D

Dmitry in Scrapy
Или если какой-то IP использовался для парсинга и наткнулся на защиту типа Cloudfare (или каку-то другую), то после N-обращений он добавляется в 'некую базу' того же Cloudfare и капча начинает вываливаться на всех сайтах, где стоит защита Cloudfare?
источник

D

Dmitry in Scrapy
Или даже вся сеть Hetzner ***.clients.your-server.de находится под фильтрами?
источник

AR

Andrey Rahmatullin in Scrapy
да просто детектится датацентровый айпи
источник

D

Dmitry in Scrapy
Ну это я понимаю, но ведь DigitalOcean не блочится?
источник

AR

Andrey Rahmatullin in Scrapy
ну его в список не добавили может
источник

AR

Andrey Rahmatullin in Scrapy
или подсетка новая, ещё неизвестная
источник

D

Dmitry in Scrapy
Т.е. блочат именно на уровне сети "clients.your-server.de"?
источник

D

Dmitry in Scrapy
Или конкретные IP адреса?
источник

AR

Andrey Rahmatullin in Scrapy
при чём тут обратка вообще
источник

AR

Andrey Rahmatullin in Scrapy
подсетки, думаю
источник

A

Andrii in Scrapy
Ну кто будет юзать для серфинга дц?)
источник

AR

Andrey Rahmatullin in Scrapy
я, ибо ркн
источник

AR

Andrey Rahmatullin in Scrapy
но это такое
источник

A

Andrii in Scrapy
:)))
источник