Size: a a a

2021 May 17

AR

Andrey Rahmatullin in Scrapy
там вебсокеты
источник

AR

Andrey Rahmatullin in Scrapy
источник

И

Илья in Scrapy
Что делать, если видишь null, просматривая код элемента?
источник

И

Илья in Scrapy
Можно ли как-то от него избавиться?
источник

IJ

Illia Ja in Scrapy
Немного нубский вопрос. Хочу использовать скрапи вместе с селениум. Вроде как можно просто в spyder дописывать куски селениума, также нашел такую вот библиотеку
https://github.com/clemfromspace/scrapy-selenium
Подскажите, что используют чаще всего?
источник

AR

Andrey Rahmatullin in Scrapy
чем просматривая и что хочется увидеть вместо него?
источник

AR

Andrey Rahmatullin in Scrapy
эту вроде
источник

И

Илья in Scrapy
Хочется увидеть не null, а смотрел через код элемента в Гугл хром
источник

AR

Andrey Rahmatullin in Scrapy
если браузер показывает нулл, значит там нулл?
источник

AR

Andrey Rahmatullin in Scrapy
или что всё-таки делаешь
источник

A

Alex in Scrapy
Я обычно такие вещи в виде словаря в список добавляю, а потом pandas корректно кол-во столбцов расставляет, даже если в каком-то из словарей полей больше/меньше, чем в остальных. Это если этот вопрос еще актуален...
источник

AR

Andrey Rahmatullin in Scrapy
все так любят цсв и пандас :)
источник

МС

Михаил Синегубов... in Scrapy
я не люблю 👀
источник

(

(o_O) in Scrapy
Ещё jsonl и jq
источник

A

Alex in Scrapy
Я и не люблю. У меня практически на всё свои велосипеды, ну а вместо пандаса кастомизированный tablib
источник

AV

Anatoli Valenda in Scrapy
Актуален. Не знал, что пандас может корректно распознать. Надо будет потестить эта фичу, когда время свободное появится. Спасибо за подсказку
источник

(

(o_O) in Scrapy
(x => x === null ? default : x)($(selector))
источник

A

Alex in Scrapy
Под капотом все это дело векторизируется numpy-ем, поэтому кол-во стобцов, в т.ч. добавляемых диначески во время прохождения по данным, не имеет значения. На сегодняшний день это единственное рабочее решение из найденных мной для неоднородных данных. Но только ради этого тащить ~50 метров numpy + ~50 метров самого пандаса лично мне не улыбается. Поэтому у меня типа есть своего чисто питонячее решение, но оно еще не готово полностью для прода.
источник

AR

Andrey Rahmatullin in Scrapy
ага
источник

AR

Andrey Rahmatullin in Scrapy
но я не люблю язык jq, но приходится, не на питоне ж их обрабатывать
источник