Телеграмм чат группы scrapy

process = CrawlerProcess(settings=get_project_settings())


def _crawl(result, spider):
    deferred = process.crawl(spider)
    deferred.addCallback(_crawl, spider)
    return deferred


_crawl(None, SpiderNameHereSpider)
process.start()

источник

22:33пожаловаться #6

Genadyi in Scrapy

Вот так запускаю

источник

22:33пожаловаться #7

Andrey Rahmatullin in Scrapy

Genadyi

process = CrawlerProcess(settings=get_project_settings())


def _crawl(result, spider):
    deferred = process.crawl(spider)
    deferred.addCallback(_crawl, spider)
    return deferred


_crawl(None, SpiderNameHereSpider)
process.start()

запускаешь как-то странно, это точно

источник

23:18пожаловаться #8

Andrey Rahmatullin in Scrapy

но где здесь "мешают друг другу"?

источник

23:18пожаловаться #9

Genadyi in Scrapy

Andrey Rahmatullin

запускаешь как-то странно, это точно

Ну у меня работает все вроде, все лупится

источник

23:30пожаловаться #10

Genadyi in Scrapy

Andrey Rahmatullin

но где здесь "мешают друг другу"?

Типо я сейчас создал 2 парсер, пытаюсь его запустить а он тупо стоит на месте и все

источник

23:31пожаловаться #11

Genadyi in Scrapy

Как удаляю 1 файл где 1 парсер

источник

23:31пожаловаться #12

Genadyi in Scrapy

Но 2 сразу пашет

источник

23:31пожаловаться #13

Andrey Rahmatullin in Scrapy

брр

источник

23:31пожаловаться #14

2020 April 27

МС

Михаил Синегубов in Scrapy

Genadyi

Вот так запускаю

не мучайся, https://docs.scrapy.org/en/latest/topics/practices.html просто выбери нужный вариант и перепиши под себя.
Запуск 10 пауков - сразу возникает куча вопросов: параллельный или последовательный запуск, используют ли пауки данные друг друга, куда они данные пишут, не будет ли каких дедлоков при параллельной работе.

вообще, пробовал и параллельный и последовательный запуск из доки, все нормально работало. Пришлось повозиться с настройками... но это уже частности.

источник

09:18пожаловаться #15

Anil Kumar in Scrapy

When I try to scrape a website it is throwing connection timed out error but when I open the same website in browser it is opening. It's content is rendered using Javascript and the website will not allow any bots to scrape. My question is, Is it possible to scrape this website or not?

источник

09:47пожаловаться #16

Anil Kumar in Scrapy

Anil Kumar

Anyone please reply..

источник

09:52пожаловаться #17

Andrii in Scrapy

Anil Kumar

Yes, it is possible

источник

09:57пожаловаться #18