Size: a a a

2020 March 14

C

Cyberdine Engineering🐤 in Scrapy
Или через if стейтмент

Если Пагинация А, парсить так
в противном случае парсить Б
источник

B

Bulatbulat48 in Scrapy
🎱
что-то я завис, не получается переходить по пагинации, в amazon, для 1 страницы селектор другой, начиная от 2 ... одинаковый. Как решить такую проблему?
Взять два селектора
источник

🎱

🎱 in Scrapy
Cyberdine Engineering🐤
Или через if стейтмент

Если Пагинация А, парсить так
в противном случае парсить Б
Понял, тоже вариант с 2 селекторами получается ?
источник

🎱

🎱 in Scrapy
Bulatbulat48
Взять два селектора
И просто if ом обработать ?
источник

AR

Andrey Rahmatullin in Scrapy
Да
источник

К

Кирилл in Scrapy
🎱
что-то я завис, не получается переходить по пагинации, в amazon, для 1 страницы селектор другой, начиная от 2 ... одинаковый. Как решить такую проблему?
просто возьми все элементы которые есть у общего предка(обертки списка)
источник

C

Cyberdine Engineering🐤 in Scrapy
🎱
Понял, тоже вариант с 2 селекторами получается ?
Ну раз есть 2 и больше страниц где селекторы отличаются то просто нужно отловить нужный
источник

C

Cyberdine Engineering🐤 in Scrapy
Найти обе страницы, вытащить оба адреса и пробовать оба на каждой странице
источник

A

Andrii in Scrapy
В чем прикол. На линуксе парсинг не работает, на виндовсе работает
источник

l

linuxoid in Scrapy
А ошибки?
источник

К

Кирилл in Scrapy
вангую, что пути
источник

A

Andrii in Scrapy
В виндовсе 200 ответ и находит хпатч в линуксе не находит 200
источник

l

linuxoid in Scrapy
Принтуй
источник

🎱

🎱 in Scrapy
как вы чистите урлы ? обычным strip или urlparse больше подходит для этого?)
источник

C

Cyberdine Engineering🐤 in Scrapy
🎱
как вы чистите урлы ? обычным strip или urlparse больше подходит для этого?)
Что значит чистим урлы
источник

🎱

🎱 in Scrapy
/Bounty-Quick-Size-Paper-Towels-Family/dp/B079VP6DH5/ref=sr_1_1?dchild=1&qid=1584184338&s=kitchen-intl-ship&sr=1-1"

например, мне нужно до ref взять урл
источник

К

Кирилл in Scrapy
🎱
/Bounty-Quick-Size-Paper-Towels-Family/dp/B079VP6DH5/ref=sr_1_1?dchild=1&qid=1584184338&s=kitchen-intl-ship&sr=1-1"

например, мне нужно до ref взять урл
оно идет вместо с скрапи, так что сразу импортируешь и используешь, устанавливать не нужно
https://w3lib.readthedocs.io/en/latest/w3lib.html#w3lib.url.url_query_cleaner
источник

🎱

🎱 in Scrapy
Кирилл
оно идет вместо с скрапи, так что сразу импортируешь и используешь, устанавливать не нужно
https://w3lib.readthedocs.io/en/latest/w3lib.html#w3lib.url.url_query_cleaner
спасибо, полезно) свой велосипед писать не хочется
источник

🎱

🎱 in Scrapy
странно, амазон меняет верстку ккаждый день? вчера писал селекторы а сегодня они уже невалидные. JS отключал перед инспектом
источник

К

Кирилл in Scrapy
думаю ты писал селекторы на классах?
источник