Size: a a a

2020 November 26

S

SoHard 🎄 in Scrapy
Тони Нони
а что плохого в бсе?
удобный очень
источник

ТН

Тони Нони in Scrapy
ну..
источник

S

SoHard 🎄 in Scrapy
особенно после селекторов и xpath
источник

ТН

Тони Нони in Scrapy
это же хорошо?
источник

ТН

Тони Нони in Scrapy
что удобный
источник

S

SoHard 🎄 in Scrapy
Тони Нони
что удобный
источник

ТН

Тони Нони in Scrapy
10\10 джоук
источник

ТН

Тони Нони in Scrapy
научи
источник

МС

Михаил Синегубов... in Scrapy
Тони Нони
это же хорошо?
если начинаешь работать именно с супа - разницы не видишь, пока не заставишь себя переучится.
но, если, не дай боже, начнешь с нормальных процессоров - реакция будет однозначная.

одна скорость инициализации чего стоит...
источник

SS

Stepan Smirnov in Scrapy
Andrey Rahmatullin
есть более сложные либы, но тут и этой хватит
а какие еще либы вы можете посоветовать для изменения html во время работы паука?
источник

AR

Andrey Rahmatullin in Scrapy
Stepan Smirnov
а какие еще либы вы можете посоветовать для изменения html во время работы паука?
re, lxml, html-text
источник

SS

Stepan Smirnov in Scrapy
спасибо
источник

SS

Stepan Smirnov in Scrapy
а существуют либы/методы, позволяющие определить тип тега конкретного <class 'scrapy.selector.unified.Selector'>?
источник

AR

Andrey Rahmatullin in Scrapy
.root.tag
источник

AR

Andrey Rahmatullin in Scrapy
если эта нода - элемент
источник

SS

Stepan Smirnov in Scrapy
А как проверить if node contains child node без подсчета количества символов '<', '>' ?
источник

AR

Andrey Rahmatullin in Scrapy
XPath
источник
2020 November 27

SC

Saurabh Chavan in Scrapy
источник

SC

Saurabh Chavan in Scrapy
How to remove these tags?
источник

МС

Михаил Синегубов... in Scrapy
Saurabh Chavan
How to remove these tags?
step 1. get text from json
step 2. use regex, w3lib.html, html2text, etc...
источник