Телеграмм чат группы scrapy

Ну мне до этого не приходила в голову идея с curl) однако, там такая тема что некоторые файлы json не так просто получить от сервера, просто по ссылке они не открываются - нужно ему передать правильный хэдер и пэйлоад. Не знаю способен ли curl на такое, почекаю )

источник

12:44пожаловаться #9

Andrey Rahmatullin in Scrapy

способен конечно

источник

12:49пожаловаться #10

Andrey Rahmatullin in Scrapy

он почти всё умеет

источник

12:49пожаловаться #11

Andrey Rahmatullin in Scrapy

в браузере даже можно сделать copy as curl и убрать лишнее

источник

12:49пожаловаться #12

СТ

Семён Трояновский in Scrapy

Спасибо за совет )

источник

12:59пожаловаться #13

Andrii in Scrapy

Вопрос по reddit'y. Есть их json. Как мне сделать итеррацию по постах?

json['posts'][????]

источник

13:02пожаловаться #14

Andrii in Scrapy

источник

13:02пожаловаться #15

Кирилл in Scrapy

for key, value in json['posts'].items():

источник

13:02пожаловаться #16

Andrey Rahmatullin in Scrapy

Andrii

Вопрос по reddit'y. Есть их json. Как мне сделать итеррацию по постах?

json['posts'][????]

это всего лишь вложенные словари и списки, базовые питоньи штуки

источник

13:04пожаловаться #17

Andrii in Scrapy

Кирилл

for key, value in json['posts'].items():

очень спасибо!

источник

13:06пожаловаться #18

РТ

Ренат Турсунбаев in Scrapy

не подскажете как CrawlSpider обязать бегать по всему списку allowed_domains и start_urls? Он поверхностно по нескольким доменам пробегает и начинает копать в один вглубь, а хотелось бы чтобы равномерно по всем доменам пробегал...

источник

14:05пожаловаться #19

Кирилл in Scrapy

вроде предполагается, что один паук == один домен

источник

14:10пожаловаться #20