Size: a a a

2020 October 21

AR

Andrey Rahmatullin in Scrapy
дальше неинтересно
источник

ЛГ

Лев Гареев in Scrapy
Andrey Rahmatullin
то есть не считал
сел и проверил парсинг 6 страниц, почему-то доходит до 16 итема и идет на след страницу, попробую поискать что не так, и не надо так резко реагировать, мои вопросы могут быть утпыми и не интересными для человека с огромным багажом, я просто учусь)
источник

AR

Andrey Rahmatullin in Scrapy
я не резко реагирую, я обращаю внимание что спрашивают одно, а отвечают другое
источник

AR

Andrey Rahmatullin in Scrapy
не надо говорить про количество итемов в логе, если ты это количество не посчитал
источник

ЛГ

Лев Гареев in Scrapy
если убирать функцию перелистывания, то парсит на странице ровно 20 итемов, с этой функцией 16, и возвращает как раз за 2 страницы 32 вместо 40. причину понять не могу, знаний не хватает, если есть намек, или путь куда смотреть, буду благодарен
источник

AR

Andrey Rahmatullin in Scrapy
Если убрать что именно?
источник

AR

Andrey Rahmatullin in Scrapy
Ну и надо смотреть сколько урлов извлекается (и заодно этот код переписать на нормальный питон)
источник

ЛГ

Лев Гареев in Scrapy
урлов извлекается 20, проверял
источник

ЛГ

Лев Гареев in Scrapy
 for i in range(len(full_product_url)):
           yield scrapy.Request(full_product_url[i], callback=self.price_parse,
                                meta={'product_url': full_product_url[i]})
       next_page = response.xpath('//div[@class="pagination span12"]//li[last()]/a/@href').extract_first()
       if next_page:
           yield scrapy.Request(
               response.urljoin(next_page),
               callback=self.parse
           )
источник

ЛГ

Лев Гареев in Scrapy
этот кусок кода - дерьмо
источник

ЛГ

Лев Гареев in Scrapy
и полагаю проблема в нем, этот сранный цикл с передачей массива ссылок + след страница, вот тут точно проблема
источник

AR

Andrey Rahmatullin in Scrapy
Лев Гареев
урлов извлекается 20, проверял
Как?
источник

ЛГ

Лев Гареев in Scrapy
запускал код и принтил список и итемы, которые отдает
источник

ЛГ

Лев Гареев in Scrapy
 for i in range(len(full_product_url)):
           yield scrapy.Request(full_product_url[i], callback=self.price_parse,
                                meta={'product_url': full_product_url[i]})
источник

ЛГ

Лев Гареев in Scrapy
источник

ЛГ

Лев Гареев in Scrapy
начинает отдавать 16, когда добавляется вот эта строка
источник

ЛГ

Лев Гареев in Scrapy
 next_page = response.xpath('//div[@class="pagination span12"]//li[last()]/a/@href').extract_first()
       if next_page:
           yield scrapy.Request(
               response.urljoin(next_page),
               callback=self.parse
           )
источник

ЛГ

Лев Гареев in Scrapy
без нее 20 спокойно парсит
источник

AR

Andrey Rahmatullin in Scrapy
Сомнительно как-то
источник

AR

Andrey Rahmatullin in Scrapy
Как считал что 16?
источник