Size: a a a

2020 December 06

D

Dmitry in Scrapy
Понятно. Но тот прокси видимо этот хттп не гляда форварднул, заменив пару полей
источник

D

Dmitry in Scrapy
Короче дело ясное, что дело темное
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
ну да, нельзя его руками указывать
Ну вообще я бы где-то это прописал что ли. Как догадаться-то? Курл и requests же нормально работают.
источник

AR

Andrey Rahmatullin in Scrapy
ну я вообще не в курсе о какой ты проблеме
источник

D

Dmitry in Scrapy
О том, что в хедере нельзя прописывать content-length 0
источник

AR

Andrey Rahmatullin in Scrapy
FormRequest сам посчитает и пропишет хедер, а так хз
источник

D

Dmitry in Scrapy
Да это понятно. Просто последовательность действия была такая: 1. Выдергиваю из мониторинга браузера курл-реквест 2. Тестирую в курле - все работает 3. Засовываю в скрапи - молча нихрена не работает, создается какой-то битый хттп реквест, который реджектится таргетом с 400
источник

D

Dmitry in Scrapy
И дальше 4 часа траблшутинга
источник

AR

Andrey Rahmatullin in Scrapy
кстати вру, может это твистед считает
источник

D

Dmitry in Scrapy
От него все зло, я всегда знал
источник

D

Dmitry in Scrapy
Issue создать на гитхабе?
источник

AR

Andrey Rahmatullin in Scrapy
если сможешь описать как воспроизвести
источник

AR

Andrey Rahmatullin in Scrapy
ну и помни про httpbin
источник

AR

Andrey Rahmatullin in Scrapy
к вопросу о дебаге в проводе
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
ну и помни про httpbin
Ага, спс. Я вот это использовал, в два клика: https://requestbin.com/
источник

D

Dmitry in Scrapy
Тоже не помогло, к сожалению - отвечал 200 ОК и показывал, что все нормальные поля. Нашел как пофиксить по чистой случайности, так бы еще мог пару часов маяться.
источник

AR

Andrey Rahmatullin in Scrapy
ты главное сравни что эти тулзы пишут до фикса и после
источник

D

Dmitry in Scrapy
На самом деле Georgiy натолкнул на решение. Я засунул в спайдер тот сниппет, чтобы twisted не капитализировал поля хедера. В результате у твистеда совсем поехала крыша и я там увидел дубликатом content-length в одной из этих тулз. Поэтому решил убрать content-length из хедера и внезапно все заработало.
источник
2020 December 07

D

Dmitry in Scrapy
Я подумаю как лучше это воспроизвести
источник

D

Dmitry in Scrapy
Andrey Rahmatullin
ты главное сравни что эти тулзы пишут до фикса и после
Подойдет?
Request("https://webhook.site/<YOUR ID>", method='POST', headers={}) >>> OK
Request("https://webhook.site/<YOUR ID>", method='POST', headers={'content-length': '0'}) >>> ERROR: <twisted.python.failure.Failure scrapy.spidermiddlewares.httperror.HttpError: Ignoring non-200 response>
источник