Size: a a a

2020 April 26

G

Genadyi in Scrapy
Мне ещё надо чтобы они лупились, а плане что работали без остановочно
источник

G

Genadyi in Scrapy
И одновременно
источник

A

Andrii in Scrapy
Ну хоть скрин или код
источник

G

Genadyi in Scrapy
Просто пустота тип
источник

G

Genadyi in Scrapy
Скоро кину сек
источник

G

Genadyi in Scrapy
process = CrawlerProcess(settings=get_project_settings())


def _crawl(result, spider):
   deferred = process.crawl(spider)
   deferred.addCallback(_crawl, spider)
   return deferred


_crawl(None, SpiderNameHereSpider)
process.start()
источник

G

Genadyi in Scrapy
Вот так запускаю
источник

AR

Andrey Rahmatullin in Scrapy
Genadyi
process = CrawlerProcess(settings=get_project_settings())


def _crawl(result, spider):
   deferred = process.crawl(spider)
   deferred.addCallback(_crawl, spider)
   return deferred


_crawl(None, SpiderNameHereSpider)
process.start()
запускаешь как-то странно, это точно
источник

AR

Andrey Rahmatullin in Scrapy
но где здесь "мешают друг другу"?
источник

G

Genadyi in Scrapy
Andrey Rahmatullin
запускаешь как-то странно, это точно
Ну у меня работает все вроде, все лупится
источник

G

Genadyi in Scrapy
Andrey Rahmatullin
но где здесь "мешают друг другу"?
Типо я сейчас создал 2 парсер, пытаюсь его запустить а он тупо стоит на месте и все
источник

G

Genadyi in Scrapy
Как удаляю 1 файл где 1 парсер
источник

G

Genadyi in Scrapy
Но 2 сразу пашет
источник

AR

Andrey Rahmatullin in Scrapy
брр
источник
2020 April 27

МС

Михаил Синегубов in Scrapy
Genadyi
Вот так запускаю
не мучайся, https://docs.scrapy.org/en/latest/topics/practices.html просто выбери нужный вариант и перепиши под себя.
Запуск 10 пауков - сразу возникает куча вопросов: параллельный или последовательный запуск, используют ли пауки данные друг друга, куда они данные пишут, не будет ли каких дедлоков при параллельной работе.

вообще, пробовал и параллельный и последовательный запуск из доки, все нормально работало. Пришлось повозиться с настройками... но это уже частности.
источник

AK

Anil Kumar in Scrapy
When I try to scrape a website it is throwing connection timed out error but when I open the same website in browser it is opening. It's content is rendered using Javascript and the website will not allow any bots to scrape. My question is, Is it possible to scrape this website or not?
источник

AK

Anil Kumar in Scrapy
Anil Kumar
When I try to scrape a website it is throwing connection timed out error but when I open the same website in browser it is opening. It's content is rendered using Javascript and the website will not allow any bots to scrape. My question is, Is it possible to scrape this website or not?
Anyone please reply..
источник

A

Andrii in Scrapy
Anil Kumar
When I try to scrape a website it is throwing connection timed out error but when I open the same website in browser it is opening. It's content is rendered using Javascript and the website will not allow any bots to scrape. My question is, Is it possible to scrape this website or not?
Yes, it is possible
источник

AK

Anil Kumar in Scrapy
Andrii
Yes, it is possible
But most of the times, out of 10 times I tried I got response only 1 or 2 times. But I have lot of data to scrape. What should I do?
источник

A

Andrii in Scrapy
Anil Kumar
But most of the times, out of 10 times I tried I got response only 1 or 2 times. But I have lot of data to scrape. What should I do?
Use proxy rotation and UA rotation, make bot behaviour to be more like human
источник