Size: a a a

2020 March 29

AR

Andrey Rahmatullin in Scrapy
что такое requests_html?
источник

S

Sergey in Scrapy
Andrey Rahmatullin
что такое requests_html?
обертка над requests и lxml
источник

S

Sergey in Scrapy
кстати, почему не все xpath-запросы скопированный из хрома работают в lxml? js нет на странице
источник

AR

Andrey Rahmatullin in Scrapy
потому что в хроме джс не выключил
источник

AR

Andrey Rahmatullin in Scrapy
ну и tbody
источник

S

Sergey in Scrapy
js выключил
что значит tbody?
источник

AR

Andrey Rahmatullin in Scrapy
tbody всегда есть в DOM, но зачастую нет в HTML
источник

AR

Andrey Rahmatullin in Scrapy
это контейнер для th и tr
источник

AR

Andrey Rahmatullin in Scrapy
а вообще это глупое занятие, полные пути юзать
источник

S

Sergey in Scrapy
да мне бы хоть какой-то путь узнать
источник

AR

Andrey Rahmatullin in Scrapy
зачем?
источник

S

Sergey in Scrapy
Andrey Rahmatullin
tbody всегда есть в DOM, но зачастую нет в HTML
дерево в хроме и lxml по-разному строится?
источник

AR

Andrey Rahmatullin in Scrapy
ты уже нашёл элемент
источник

S

Sergey in Scrapy
нашел по айдишнику, он разный на разных страницах
источник

AR

Andrey Rahmatullin in Scrapy
путь будет тем более разный
источник

S

Sergey in Scrapy
нет, путь одинаковый
источник

AR

Andrey Rahmatullin in Scrapy
Sergey
дерево в хроме и lxml по-разному строится?
да, конечно
источник

AR

Andrey Rahmatullin in Scrapy
lxml не браузер
источник

S

Sergey in Scrapy
Andrey Rahmatullin
да, конечно
а как писать запросы тогда?
источник

AR

Andrey Rahmatullin in Scrapy
кстати неконформный html тоже разные парсеры будут по-разному парсить
источник