Size: a a a

2020 March 16

SS

Sergey Sergey in Scrapy
Динамическую бы подкачку прокси замутить.
источник

К

Кирилл in Scrapy
Sergey Sergey
Динамическую бы подкачку прокси замутить.
Замути) там запрос на фичу с 2017 висит
источник

МС

Михаил Синегубов in Scrapy
Sergey Sergey
А, там свои условия пилить можно
Ага. Приходилось ловить ситуацию, когда бан отдавал 404 с определенным текстом. Ну, вот так ребята заморочились.
источник

A

Alexsander_1 in Scrapy
Вопрос по парсингу сайта https://ulyanovsk.220-volt.ru/, нужно спарсить именно requests.get. Но в ответ прилетает только функция, дом элементов нет в response. Контент на сайт подтягивается через туннель, как парсить такой сайт именно с requests?)
источник

SS

Sergey Sergey in Scrapy
Кирилл
Замути) там запрос на фичу с 2017 висит
Да я, к сожалению, пока не осваивал миддлаври, но, видимо, придется...
источник

A

Alexsander_1 in Scrapy
Страницу рендерит js скрипт
источник

МС

Михаил Синегубов in Scrapy
Нахрена динамика? Единственное для чего приходит на ум - фришные прокси с чекера. Свят свят их пользовать 😂
источник

К

Кирилл in Scrapy
Михаил Синегубов
Нахрена динамика? Единственное для чего приходит на ум - фришные прокси с чекера. Свят свят их пользовать 😂
Думаю ты правильно догадался)
источник

SS

Sergey Sergey in Scrapy
Михаил Синегубов
Нахрена динамика? Единственное для чего приходит на ум - фришные прокси с чекера. Свят свят их пользовать 😂
Ну, если мне нужно 300 прокси, то тут или разоряться или парсить и динамически выдавать скрейпи
источник

К

Кирилл in Scrapy
Хэх, что-то все новички один и тот же путь проходят
источник

SS

Sergey Sergey in Scrapy
Кирилл
Хэх, что-то все новички один и тот же путь проходят
Поделись)
источник

SS

Sergey Sergey in Scrapy
Верным путем)
источник

К

Кирилл in Scrapy
Alexsander_1
Вопрос по парсингу сайта https://ulyanovsk.220-volt.ru/, нужно спарсить именно requests.get. Но в ответ прилетает только функция, дом элементов нет в response. Контент на сайт подтягивается через туннель, как парсить такой сайт именно с requests?)
У меня не открывается. Если там вэб сокет тунель, как ты говоришь, через requests никак
источник

К

Кирилл in Scrapy
Sergey Sergey
Верным путем)
Покупай прокси
источник

К

Кирилл in Scrapy
5 приватных прокси будет лучше нескольких сотен фришных
источник

МС

Михаил Синегубов in Scrapy
Alexsander_1
Вопрос по парсингу сайта https://ulyanovsk.220-volt.ru/, нужно спарсить именно requests.get. Но в ответ прилетает только функция, дом элементов нет в response. Контент на сайт подтягивается через туннель, как парсить такой сайт именно с requests?)
хм, то что я вижу, варианты:
1. расковырять JS
2. выполнить JS через тот же Js2Py (х/з, может и проканает)
3. пользовать браузер (силениум, сплеш, пупитер)
источник

SS

Sergey Sergey in Scrapy
Кирилл
5 приватных прокси будет лучше нескольких сотен фришных
Быстровато их банят при большом потоке...
источник

МС

Михаил Синегубов in Scrapy
а вообще, клево сделали :), я про 220 вольт
источник

A

Alexsander_1 in Scrapy
Михаил Синегубов
хм, то что я вижу, варианты:
1. расковырять JS
2. выполнить JS через тот же Js2Py (х/з, может и проканает)
3. пользовать браузер (силениум, сплеш, пупитер)
Спасибо за мысли, третий вариант точно работает
источник

К

Кирилл in Scrapy
Sergey Sergey
Быстровато их банят при большом потоке...
Не делай большой поток, ты должен настроить парсинг, так чтоб не банили
источник