Size: a a a

2020 March 26

МС

Михаил Синегубов in Scrapy
🎅 Austin Bluethy
Почему user-agent не работает и выводится Scrapy?

Код - https://nekobin.com/zowinururo
источник

К

Кирилл in Scrapy
Не работает потому что запросы начинаются в start_requests
источник

🎅B

🎅 Austin Bluethy in Scrapy
Я зашел в
setting.py
и добавил туда свой
headers
. Я правильно сделал или так делать не следует?
источник

🎅B

🎅 Austin Bluethy in Scrapy
Кирилл
Что за connect
Это же просто название функции
источник

🎅B

🎅 Austin Bluethy in Scrapy
Ее вроде можно как угодно называть, нет?
источник

AR

Andrey Rahmatullin in Scrapy
🎅 Austin Bluethy
Я зашел в
setting.py
и добавил туда свой
headers
. Я правильно сделал или так делать не следует?
куда добавил и как
источник

AR

Andrey Rahmatullin in Scrapy
и зачем
источник

К

Кирилл in Scrapy
Хоть 50 таких сделай, на запрос это не повлияет
источник

AR

Andrey Rahmatullin in Scrapy
USER_AGENT это отдельная настройка если что
источник

🎅B

🎅 Austin Bluethy in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
ну хоть без Content-Length
источник

AR

Andrey Rahmatullin in Scrapy
я кстати не знаю у кого тут приоритет, у этого или у USER_AGENT
источник

🎅B

🎅 Austin Bluethy in Scrapy
Ну, надеюсь я каких-то принципов scrapy не нарушил
источник

🎅B

🎅 Austin Bluethy in Scrapy
Andrey Rahmatullin
я кстати не знаю у кого тут приоритет, у этого или у USER_AGENT
Не могу сказать точно, но когда я очистил поле
DEFAULT_REQUEST_HEADERS
и добавил user-agent в
USER_AGENT
все заработало и сайт перестал выдавать ошибку 404
источник

D

D in Scrapy
Добрый день, уважаемые доны!
Помогите, пожалуйста, разобраться:
в книге Димитриоса (2016 г) JavaScript парситься через json.loads
а в интернетах советуют использовать Splash.
Подскажите, пожалуйста, в сегодняшних реалиях стоит разбираться в первом или не тратить время и изучать сразу второй вариант?
источник

AR

Andrey Rahmatullin in Scrapy
стоит конечно
источник

К

Кирилл in Scrapy
через json.loads парситься json. Если ты открывашь страницу и она откуда-то запрашивает данные, которые возвращаются в json, тогда это хороший случай и ты можешь сразу же использавать этот url.
Бывают же моменты, когда необходимо выполнить js на странице, для этого можно использовать splash
источник

D

D in Scrapy
Понял, спасибо за ответы!
Может у кого есть на примете сайты, на которых есть javaScript  и можно потренироваться.

А то я на сильно сложные натыкаюсь
источник

К

Кирилл in Scrapy
http://toscrape.com/ там есть
источник

МС

Михаил Синегубов in Scrapy
хм, на тоскрейп есть обработка текста через JS? или речь о ajax подгрузке?
источник