I have tried to crawl this url https://www.forexfactory.com. It returned no response. I also used scrapy shell command: scrapy shell https://www.forexfactory.com. It is still no luck. Is there something on this website prevent from crawling? Anyone can help? Thanks.
Всем привет! Может подскажите хотя бы в каком направлении думать. 2 контейнера - 1-й со airflow и scrapy 2-й splash (splash_cont). делаю из первого конта curl http://splash_cont:8050/ - работает ок но когда scrapy пытается идти по тому же адресу - scrapy shell http://splash_cont:8050 не получается выдает invalid hostname: splash_cont
я делал так что ставил всем контам network_mode: crawler-network тогда scrapy видел splash но другая проблема возникала - airflow переставал видеть постгре
I have tried to crawl this url https://www.forexfactory.com. It returned no response. I also used scrapy shell command: scrapy shell https://www.forexfactory.com. It is still no luck. Is there something on this website prevent from crawling? Anyone can help? Thanks.