Size: a a a

2020 March 16

МС

Михаил Синегубов in Scrapy
Genadyi
Есть инструмент который правильно даст xpath вытащить?
есть, но будет кривой 😄
вообще, почти все тестеры для хрома умеют генерить xpath/css, но лучше бы они этого не делали :)
источник

G

Genadyi in Scrapy
Да я заметил
источник

G

Genadyi in Scrapy
Они не очень
источник

М

Мак in Scrapy
ScrapeMate Beta для firefox
источник

MV

Maksim Vladimirovich in Scrapy
новая верстка фейсбука )
источник

AR

Andrey Rahmatullin in Scrapy
удобно, можно пароли не генерить, а отсюда взять
источник

МС

Михаил Синегубов in Scrapy
Andrey Rahmatullin
удобно, можно пароли не генерить, а отсюда взять
Не, не отвечает требованиям некоторых сайтов. Нет больших буковок и символов...
А вообще, идейка норм
источник

AR

Andrey Rahmatullin in Scrapy
:))
источник

MV

Maksim Vladimirovich in Scrapy
Andrey Rahmatullin
удобно, можно пароли не генерить, а отсюда взять
А как по таким сайтам ползать, только через скриншоты и распознавание текста?
источник

AR

Andrey Rahmatullin in Scrapy
не знаю, смотреть надо, не всегда классы нужны чтобы найти
источник

МИ

Михаил Иноземцев in Scrapy
Maksim Vladimirovich
А как по таким сайтам ползать, только через скриншоты и распознавание текста?
жестко еще по тегу body>div>div>div>div
источник

B

Bulatbulat48 in Scrapy
Maksim Vladimirovich
А как по таким сайтам ползать, только через скриншоты и распознавание текста?
скорее всего в каком-то js файле лежит алгоритм обфускации
источник

МС

Михаил Синегубов in Scrapy
Bulatbulat48
скорее всего в каком-то js файле лежит алгоритм обфускации
ну, судя по путям к CSS, скорее нет, чем да.
Я бы поставил на предгенерацию классов css, не думаю, что это такая большая проблема
источник

МС

Михаил Синегубов in Scrapy
и да, в самом то css, такие же "веселые" классы
источник

G

Genadyi in Scrapy
https://gist.github.com/dasdWEQWEQWA/4ab2d17647daf49aa668183cba448f4c правильно я все делаю? Или нет?
источник

AR

Andrey Rahmatullin in Scrapy
что это и зачем? реформатилка джсона?
источник

G

Genadyi in Scrapy
Andrey Rahmatullin
что это и зачем? реформатилка джсона?
Код написан. Если 1 файл с ошибкой читается то дата берётся из 2 и перезаписывается в 1
источник

AR

Andrey Rahmatullin in Scrapy
json.dump(data, file, indent=4) это как должно работать? file мало того что открывался на чтение, так ещё и не смог открыться
источник

VB

Vladyslav Babych in Scrapy
Привет, мне нужно запоминать индекс нахождения на странице. При этом я хожу поочерёдно по страницам, соответственно на каждую страницу запускается новый метод parse c помощью inline request. Как мне можно между разными запусками parse передать уже спаршенное колличество элементов. Что-бы счётчик не начинался на каждой старнице сначала?
источник

AR

Andrey Rahmatullin in Scrapy
Зачем это всё?
источник