Size: a a a

2020 October 21

A

Andrii in Scrapy
с такими
источник

ЛГ

Лев Гареев in Scrapy
Andrii
бл....щас скину переписку
:D
источник

S

SoHard 🎄 in Scrapy
Andrii
бл....щас скину переписку
уже была тут, он удалил, а потом и акк удалил
источник

S

SoHard 🎄 in Scrapy
сейчас я его клиенту с фриланса парсю
источник

i

i in Scrapy
Victor
Можно ли в скрапи один спайдер запустить так чтобы он на нескольких ядрах проца выполнялся? В разных процессах?
а зачем тебе? ты уже добился заветной цифры в 4-4.5к айтемсов в секунду (упс, в минуту!) и хочешь еще больше прироста скорости? просто скрапи обычно жрет ну 5-20% проца. Основной простой в IO, и не дисковом, а самого интернетика=сайта, который ты парсишь. Но вообще, можешь покопать в ту сторону: https://scrapyd.readthedocs.io/en/stable/config.html?highlight=cpu#max-proc-per-cpu
источник

S

SoHard 🎄 in Scrapy
о нём он сказал только "странный" хотя заказ оплатил и отзыв нормальный оставил
источник

A

Andrii in Scrapy
источник

МС

Михаил Синегубов... in Scrapy
😂, охохох, вот тут то тебя и спалили
источник

i

i in Scrapy
"хакер сказал"
источник

ЛГ

Лев Гареев in Scrapy
Хакер мне сказал что , то что вы просите используют в основном для этого .
источник

ЛГ

Лев Гареев in Scrapy
это в цитаты
источник

К

Кирилл in Scrapy
смешно)
источник

К

Кирилл in Scrapy
Нужно тоже так научиться языком трепать, клиентов раскручивать
источник

i

i in Scrapy
а что за файл? или не показали, опасную штуку-то?
источник

К

Кирилл in Scrapy
за опасность, цена сразу х2
источник

V

Victor in Scrapy
i
а зачем тебе? ты уже добился заветной цифры в 4-4.5к айтемсов в секунду (упс, в минуту!) и хочешь еще больше прироста скорости? просто скрапи обычно жрет ну 5-20% проца. Основной простой в IO, и не дисковом, а самого интернетика=сайта, который ты парсишь. Но вообще, можешь покопать в ту сторону: https://scrapyd.readthedocs.io/en/stable/config.html?highlight=cpu#max-proc-per-cpu
У меня тормозит обработка данных, которые скачались. А делать так чтобы сначала скачать, а потом обработать - не очень хочется. Там места нужно ооочень много.
источник

V

Victor in Scrapy
4-5к это столько concurrent_request? Что то как то дофига
источник

i

i in Scrapy
это очень странно, ты работаешь со скрапи? сколько у тебя итемсов и сколько элементов в итеме?
источник

i

i in Scrapy
(про секунду - это я попутал, 4к в минуту) и 4к это обычно пробег по кэшу)) т.е. - без учета интернетика. где-то 10-20 значений в item'e, самих айтемов- ну штук 20тыщ
источник

V

Victor in Scrapy
Я там страницу html переколбашиваю, индексы для нее делаю и т.п Там без айтемов - просто в parse хреначу
источник