Size: a a a

2021 November 19

V

Vladimir in Python
Пытаюсь спарсить данные с сайта, но кидает ошибку. Как обойти?
источник

r

r in Python
Что тут надо увидеть?
источник

r

r in Python
Видимо, сайт против того, что ты его парсишь
источник

V

Vladimir in Python
похоже. попытался спарсить ozon.ru)
источник

r

r in Python
Земля пухом)
источник

V

Vladimir in Python
вообще никак нельзя обойти?
источник

r

r in Python
Давно парсингом занимаешься?
источник

V

Vladimir in Python
1 час)
источник

r

r in Python
Обойти можно, но не тебе :)
Тебе ещё долго
источник

r

r in Python
В теории можешь селениум попробовать, но мейби озон и его узнаёт
источник

V

Vladimir in Python
расскажи
источник

J

Je in Python
Можно апи у них попросить и купить, а можно бан получить в этом чате за коллектинг чужих данных) Олсо здесь есть люди с Озона в чате и они уже наблюдают за твоими движениями
источник

V

Vladimir in Python
да не, просто решил поучиться парсить сайты и что первое в голову пришло это маркетплейс спарсить попробовать какой-то. Тип пет проект)
источник

r

r in Python
Маркетплейсы очень не любят такое :)
источник

r

r in Python
И что эти следящие сделают? По рукам надают?
источник

r

r in Python
Думаю, парсить озон даже без смены юзер-агента пробуют минимум сотню раз в день.

А кто-то хорошо этим занимается и получает хорошие деньги ещё. За такими надо следить, а не за теми, кто в парсинг пытается войти
источник

J

Je in Python
Плохой пет-проект, парсинг это вообще не лучший вход, через заднюю дверь так скажем. Лучше посмотри их API и поинтересуйся как это устроено, может что-то полезное подчерпнешь)
https://docs.ozon.ru/api/seller/
источник

J

Joika in Python
Кто мне подскажет, как мне загружать прокси в реквест запрос вроде все сделал, но выдает ошибку requests.exceptions.ConnectTimeout, запос отправляю на https://mail.yandex.ru/, прокси отправляются в таком формате: {'http': 'socks4://128.199.111.243:60290', 'https': 'socks4://128.199.111.243:60290'}
источник

J

Joika in Python
прокси 100% живые и рабочие
источник

J

Joika in Python
не могу понять в чем дело, с этими проксями, есть предположения что они в бане но как тогда получить/купить  те что не в бане
источник