Size: a a a

2021 May 31

AR

Andrey Rahmatullin in Scrapy
это из чата
источник

AR

Andrey Rahmatullin in Scrapy
тут уж просто или "помощи ноль фуфу", или "готов дать денег"
источник

AR

Andrey Rahmatullin in Scrapy
если не готов так стековерфлоу и поехали
источник

JN

Jax Neyon in Scrapy
буду дальше бороздить просторы езернета
источник

МС

Михаил Синегубов... in Scrapy
по ссылке выше тарифы с нуля начинаются
источник

IP

Ivan Pushin in Scrapy
Ребята, привет 👋🏼 Нужен совет, с какой стороны подойти к задаче и является ли scrapy здесь наиболее подходящим инструментом.
Задача: нужно посчитать как часто ключевые слова встречаются на сайте. Сайтов около 2000 штук. Ключевых слов 150 штук. Считаю, как часто упоминаются продукты на сайтах продавцов.
Как сейчас делаю: делаю реквесты к каждому url сайта, ищу ключевые слова в тексте страницы, извлекаю новые url. и так пока не перейду по всем ссылкам на сайте.
Что хочется улучшить: Главная проблема — скорость, текущее решение работает довольно медленно. Среди сайтов есть маркетплейсы, где бывает до нескольких тысяч разных товаров.

Я полный нуб в scrapy (запускал уже готовые спайдеры, но до разработки своих так и не дошёл), но насколько я понимаю scrapy отправляет запросы ассинхронно, поэтому для решения моей задачи это наиболее подходящий инструмент, как мне кажется.

Разумеется, кто-то уже делал что-то подобное, хочется посмотреть какие тут есть best practices.

И ещё, на случай если у меня ума не хватит сделать всё самому, сколько такое решение могло бы стоить? Спасибо!
источник

AR

Andrey Rahmatullin in Scrapy
ну а что тут улучшать
источник

AR

Andrey Rahmatullin in Scrapy
медленно это "хотелось бы быстрее" или "считаю что можно быстрее"?
источник

IP

Ivan Pushin in Scrapy
Думаю, что можно быстрее если распараллелить запросы и не делать их по очереди. Насколько я понял scrapy умеет делать реквесты параллельно.
источник

AR

Andrey Rahmatullin in Scrapy
умеет и делает
источник

AR

Andrey Rahmatullin in Scrapy
источник

AR

Andrey Rahmatullin in Scrapy
хотя смотря как это всё сделано, одним пауком или тысячей
источник

IP

Ivan Pushin in Scrapy
Спасибо, изучу!
источник

DA

Danila Artyukhov in Scrapy
Почему парсится только 1 страница. Он должен проверить данные и если они есть, то перейти на следующую страницу
источник

AR

Andrey Rahmatullin in Scrapy
и что происходит вместо этого?
источник

МС

Михаил Синегубов... in Scrapy
ошибка вылетает, наверное :)
источник

DA

Danila Artyukhov in Scrapy
источник

DA

Danila Artyukhov in Scrapy
Один проход
источник

AR

Andrey Rahmatullin in Scrapy
лог читай.
источник

МС

Михаил Синегубов... in Scrapy
лог дай,
источник