Size: a a a

2020 March 16

К

Кирилл in Scrapy
or get two files?
источник

AK

Anil Kumar in Scrapy
I want the same file to be downloaded multiple times.
источник

AK

Anil Kumar in Scrapy
Without replacing the first one
источник

К

Кирилл in Scrapy
make your own custom pipeline from FilesPipeline with overrided method file_path
источник

К

Кирилл in Scrapy
something like this:
def file_path(self, request, response=None, info=None):
       return f'files/{uuid.uuid4().hex}')
источник

AK

Anil Kumar in Scrapy
What is that uuid
источник

К

Кирилл in Scrapy
it's from stdlib
источник

К

Кирилл in Scrapy
import uuid, will generate unique id
источник

AK

Anil Kumar in Scrapy
Ok
источник

AK

Anil Kumar in Scrapy
Кирилл
import uuid, will generate unique id
Thank you
источник

К

Кирилл in Scrapy
and maybe set  FILES_EXPIRES=0 in settings, i'm not sure, try it
источник

AB

Alexander B in Scrapy
Михаил Синегубов
да, и фикс. делаи это первое что надо поставить, + в один "поток"
поправил, пока все ровно😌
источник

A

Andrii in Scrapy
Ребят, помогите: делаю        
next_page_url = extract_with_xpath("//a[contains(@label, 'Next Page')]/@href")
       if next_page_url is not None:
           yield scrapy.Request(response.urljoin(next_page_url))
источник

A

Andrii in Scrapy
получаю
2020-03-16 19:44:56 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.bigbear.com/events/full-circle-snowboarding-event/None/> from <GET https://www.bigbear.com/events/full-circle-snowboarding-event/None>
2020-03-16 19:45:04 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.bigbear.com/events/moonlight-forest-paint-n-sip/None/> from <GET https://www.bigbear.com/events/moonlight-forest-paint-n-sip/None>
2020-03-16 19:45:10 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.bigbear.com/events/wyatts-honky-tonk-weekends/None/> from <GET https://www.bigbear.com/events/wyatts-honky-tonk-weekends/None>
2020-03-16 19:45:16 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.bigbear.com/events/wildflower-walks/None/> from <GET https://www.bigbear.com/events/wildflower-walks/None>
источник

A

Andrii in Scrapy
оно переходит на следующую страницу но все линки с нее с /none/
источник

К

Кирилл in Scrapy
То чувство, когда написал is not None, а оно все равно None(((
источник

AR

Andrey Rahmatullin in Scrapy
не /none/, а где-то ты сунул питоний None в них
источник
2020 March 17

i

ildar in Scrapy
я тоже помню так писал, еще тема if a is not None and a!="" and a is not "":
чтобы точно что-то да сработало
источник

AR

Andrey Rahmatullin in Scrapy
Чо ж не if a
источник

BK

Boris Krutskih in Scrapy
Всем привет.
Подскажите пожалуйста что лучше использовать для парсинга сайтов?
Сейчас в голове есть такая связка, Django как админ панель куда будут прилетать данные после парсинга, и scrapy собсно для самого парсинга, может подскажете ещё моменты на которые нужно обратить внимание?
источник