Size: a a a

2020 October 21

AR

Andrey Rahmatullin in Scrapy
Скрапи однопоточный.
источник

i

i in Scrapy
ну ты запускай через scrapyd, вангую будет тебе на четырех по отдельному скрапи
источник

AR

Andrey Rahmatullin in Scrapy
И да, выносить обработку, но это ж думать надо
источник

AR

Andrey Rahmatullin in Scrapy
Ну и блокирующая обработка один хрен блочит весь скрапи (зато думать не надо)
источник

i

i in Scrapy
i
дальше уже копать только в какие-то си-инлайны там или другие ускорения питона аля этого, как его
короче я забыл как этот быстрый питон называется. ну или там на го или расте написать. или быструю либу найти какую-нибудь, которая или mkl, или simd, или GPU юзает
источник

G

Georgiy in Scrapy
Victor
Можно ли в скрапи один спайдер запустить так чтобы он на нескольких ядрах проца выполнялся? В разных процессах?
год назад писали, что вроде бы можно это (или не совсем это) сделать средствами twisted .. deferToThread, но это еще не достаточно документировано
https://github.com/scrapy/scrapy/issues/3850
источник

AR

Andrey Rahmatullin in Scrapy
Что там документировать
источник

i

i in Scrapy
да раз ему даже айтемсы не нужны, можно просто наладить общение с соседним скриптом на multiprocessing, который молотит данные. Ну либо на scrapyd запустить попробовать и указать эти max-proc и max-proc-per-cpu и может даже взлетит условная "параллель" по всем ядрам
источник

i

i in Scrapy
вариант - переписать обработку, потыркать там в пичарме этот профилировщик, глянуть кто больше всего времени жрет, оптимизировать эту штуку
источник

V

Victor in Scrapy
А как скрапи в пичарме пульнуть?
источник

V

Victor in Scrapy
я ее только через терминал умею запускать
источник

ЛГ

Лев Гареев in Scrapy
Victor
А как скрапи в пичарме пульнуть?
я через анаконду
источник

ЛГ

Лев Гареев in Scrapy
ебашу
источник

ЛГ

Лев Гареев in Scrapy
она у меня в стандартное окружение не встает
источник

i

i in Scrapy
помню вот на одном проекте открыл для себя вместо import json на import orjson и все, job done)))
источник

V

Victor in Scrapy
пфф
источник

i

i in Scrapy
Victor
А как скрапи в пичарме пульнуть?
не понял вопроса, так же как любой питонячий скрипт. Ну я да, через окружение конды запускаю, просто потому-что через конду оно там меньше на старте индексирует питонолибы почему-то
источник

ЛГ

Лев Гареев in Scrapy
i
не понял вопроса, так же как любой питонячий скрипт. Ну я да, через окружение конды запускаю, просто потому-что через конду оно там меньше на старте индексирует питонолибы почему-то
у меня на обычном вообще не вставало никак :D
источник

V

Victor in Scrapy
вот и у меня
источник

ЛГ

Лев Гареев in Scrapy
Victor
вот и у меня
через конду
источник