Size: a a a

2021 May 24

(

(o_O) in Scrapy
(тот что ctrl+u)
источник

S

SoHard 🎄 in Scrapy
хз помню чот хром или фф сам tbody рисует
источник

(

(o_O) in Scrapy
неа
источник

BG

Bashir Gaitukiev in Scrapy
спасибо 👏
источник

МС

Михаил Синегубов... in Scrapy
он рисует и добавляет в "Инспекторе"
источник

(

(o_O) in Scrapy
это когда в девтулс смотришь, видишь исправленный, а ctrl+u оригинал показывает
источник

VB

Vlad Belov in Scrapy
а что должен увидеть? неправильная разметка?
источник

(

(o_O) in Scrapy
кстати lxml в основном таки парсит невалидный хтмл, но достать его можно только через xpath, cssselect лажает
источник

МС

Михаил Синегубов... in Scrapy
а оно там точно есть? а то, может, через JS....
источник

VB

Vlad Belov in Scrapy
нужные элементы, которые не парсятся скрепи, есть..
источник

(

(o_O) in Scrapy
Стандартный подход: отключить js и подобрать селекторы в devtools,  затем проверить в scrapy shell
источник

(

(o_O) in Scrapy
Дай url и селекторы
источник

VB

Vlad Belov in Scrapy
https://ru.converse.com/washed-tonal-baseball-mpu-10019544227?childSku=10019544227-OneSize
response.xpath('//div[@class=$val]', val='sidebar sticky-sidebar').get()

например вот
источник

VB

Vlad Belov in Scrapy
response.xpath('//h1[@class=$val]/text()', val='product-name fs20 fw-bold').get()
источник

S

SoHard 🎄 in Scrapy
js выключи
источник

(

(o_O) in Scrapy
Ну и нету там класса sticky-sidebar, только в style
источник

(

(o_O) in Scrapy
Во-во
источник

МС

Михаил Синегубов... in Scrapy
угу, и данные (может даже и все) аккуратненько лежат в JSON
источник

S

SoHard 🎄 in Scrapy
я может тупой ворос азадам, а что за xpath через запятую?
источник

(

(o_O) in Scrapy
Угу, и я не понял этот $val, пхп прям
источник