Телеграмм чат группы scrapy

Немного нубский вопрос. Хочу использовать скрапи вместе с селениум. Вроде как можно просто в spyder дописывать куски селениума, также нашел такую вот библиотеку
https://github.com/clemfromspace/scrapy-selenium
Подскажите, что используют чаще всего?

GitHub

clemfromspace/scrapy-selenium

Scrapy middleware to handle javascript pages using selenium - clemfromspace/scrapy-selenium

источник

16:27пожаловаться #5

Andrey Rahmatullin in Scrapy

чем просматривая и что хочется увидеть вместо него?

источник

16:34пожаловаться #6

Andrey Rahmatullin in Scrapy

эту вроде

источник

16:35пожаловаться #7

Илья in Scrapy

Хочется увидеть не null, а смотрел через код элемента в Гугл хром

источник

16:37пожаловаться #8

Andrey Rahmatullin in Scrapy

если браузер показывает нулл, значит там нулл?

источник

16:37пожаловаться #9

Andrey Rahmatullin in Scrapy

или что всё-таки делаешь

источник

16:38пожаловаться #10

Alex in Scrapy

Я обычно такие вещи в виде словаря в список добавляю, а потом pandas корректно кол-во столбцов расставляет, даже если в каком-то из словарей полей больше/меньше, чем в остальных. Это если этот вопрос еще актуален...

источник

16:41пожаловаться #11

Andrey Rahmatullin in Scrapy

все так любят цсв и пандас :)

источник

16:47пожаловаться #12

МС

Михаил Синегубов... in Scrapy

я не люблю 👀

источник

16:48пожаловаться #13

(

(o_O) in Scrapy

Ещё jsonl и jq

источник

16:48пожаловаться #14

Alex in Scrapy

Я и не люблю. У меня практически на всё свои велосипеды, ну а вместо пандаса кастомизированный tablib

источник

16:49пожаловаться #15

Anatoli Valenda in Scrapy

Актуален. Не знал, что пандас может корректно распознать. Надо будет потестить эта фичу, когда время свободное появится. Спасибо за подсказку

источник

16:54пожаловаться #16

(

(o_O) in Scrapy

(x => x === null ? default : x)($(selector))

источник

16:58пожаловаться #17

Alex in Scrapy

Под капотом все это дело векторизируется numpy-ем, поэтому кол-во стобцов, в т.ч. добавляемых диначески во время прохождения по данным, не имеет значения. На сегодняшний день это единственное рабочее решение из найденных мной для неоднородных данных. Но только ради этого тащить ~50 метров numpy + ~50 метров самого пандаса лично мне не улыбается. Поэтому у меня типа есть своего чисто питонячее решение, но оно еще не готово полностью для прода.

источник

17:00пожаловаться #18

Andrey Rahmatullin in Scrapy

ага

источник

17:04пожаловаться #19

Andrey Rahmatullin in Scrapy

но я не люблю язык jq, но приходится, не на питоне ж их обрабатывать

источник

17:04пожаловаться #20