Size: a a a

2020 October 30

ЛГ

Лев Гареев in Scrapy
сайт легкий, jsa не нашел, в тз есть сомнительные формулировки про фото и второй ценник оптовый, про фото, зачем их называть, если качаются ссылки на них?
источник

ДТ

Даниил Трофимов... in Scrapy
Лев Гареев
сайт легкий, jsa не нашел, в тз есть сомнительные формулировки про фото и второй ценник оптовый, про фото, зачем их называть, если качаются ссылки на них?
да,но я уже сделал ,там по пути много проблем
источник

S

SoHard 🎄 in Scrapy
источник

ДТ

Даниил Трофимов... in Scrapy
работает
источник

ДТ

Даниил Трофимов... in Scrapy
нет
источник

G

Georgiy in Scrapy
Добавь priority в запросы
источник

A

Andrii in Scrapy
Georgiy
Добавь priority в запросы
куда какой? я думаю пока луп не пройдет оно дальше ж не будет посилать? или нет?
источник

МС

Михаил Синегубов... in Scrapy
Andrii
куда какой? я думаю пока луп не пройдет оно дальше ж не будет посилать? или нет?
будет
источник

A

Andrii in Scrapy
def parse(self, response):
       for country in self.country_codes:
           for industry in self.industry_codes:
               for revenue in range(self.min_revenue, self.max_revenue, 1_000_000):
                   max_revenue = revenue + 1_000_000
                   yield scrapy.Request(
                       url=f'https://www.emis.com/php/company-profile/index/search?rpp=50&sort'
                           f'prod[]={country}&multiselect_0={country}'
                           f'&indu[]={industry}&multiselect_1={industry}'
                           f'&cmpy_tr_usd_min={revenue}&cmpy_tr_usd_max={max_revenue}',
                       headers=self.headers,
                       callback=self.parse_category
                   )
сюда приорити 2, а в той что скрапить страницЬІ то приорити 1?
источник

A

Andrii in Scrapy
никогда еще их не юзал
источник

ЛГ

Лев Гареев in Scrapy
Andrii
никогда еще их не юзал
Я ставил приорити, когда у меня терялись итемы при парсинге многостранички
источник

МС

Михаил Синегубов... in Scrapy
ох... там луп насколько, десятки или на сотки тыс запросов?
источник

A

Andrii in Scrapy
десятки точно
источник

A

Andrii in Scrapy
на 6000 запросах 20гб оперативки забило
источник

A

Andrii in Scrapy
та дам итого только 3 млн айтмемов
источник

AR

Andrey Rahmatullin in Scrapy
да, не надо ставить в очередь сразу много запросов
источник

AR

Andrey Rahmatullin in Scrapy
я, впрочем, вообще против идеи обработки миллионов запросов в одном джобе
источник

G

Georgiy in Scrapy
Andrii
куда какой? я думаю пока луп не пройдет оно дальше ж не будет посилать? или нет?
в parse_category - 1, parse_company - 2, в parse - 0 (по умолчанию)
источник

МС

Михаил Синегубов... in Scrapy
Andrii
та дам итого только 3 млн айтмемов
а почему не через базу?
источник

МС

Михаил Синегубов... in Scrapy
от, вообще, безгеморойный вариант. И прерывай, и дособирай, и ипись что хочешь
источник