Size: a a a

2020 April 25

VZ

Vladislav Zadorozhnii in Scrapy
спасибо большое!
источник
2020 April 26

A

Andrii in Scrapy
Vladislav Zadorozhnii
Ребят, натолкнулся на проблему, пробовал парсить yelp.com и словил бан. Не получалось подключить user_agent и proxy, я решил попробовать ROBOTSTXT_OBEY = False и видимо после 150 запросов начал получать 503 ошибку. Что в таких ситуациях можно сделать, подскажите пожалуйста?
Покажи скрипт, как не получалось подкрутить юзер-агента?
источник

Asen Баал in Scrapy
что за хрень, не могу получить доступ ни к одному элементу здесь
источник

Asen Баал in Scrapy
источник

Asen Баал in Scrapy
Делаю фул x path к любому элементу и селениум ничего не видит
источник

FG

Faginator Gerasimov in Scrapy
for item in response.xpath('//div[@class="items_div"]'):
    link = item.xpath('//a[@class="Link_here"]/@href').extract()
    print(link)
Как сделать так чтобы он по одному вытаскивал link а не весь список кидал мне?
источник

FG

Faginator Gerasimov in Scrapy
?
источник

AR

Andrey Rahmatullin in Scrapy
поменять extract() на extract_first() (точнее на get())
источник

AR

Andrey Rahmatullin in Scrapy
и поменять абсолютный путь в xpath на относительный
источник

AR

Andrey Rahmatullin in Scrapy
т.е. // убрать или поменять на .// в зависимости от того что надо
источник

FG

Faginator Gerasimov in Scrapy
Спасибо работает
источник

FG

Faginator Gerasimov in Scrapy
как сделать так чтобы если он не нашел нужный путь то не было экзепшена а просто он забил и дальше парсил?
источник

FG

Faginator Gerasimov in Scrapy
Faginator Gerasimov
for item in response.xpath('//div[@class="items_div"]'):
    link = item.xpath('//a[@class="Link_here"]/@href').extract()
    print(link)
Как сделать так чтобы он по одному вытаскивал link а не весь список кидал мне?
если это в пример брать
источник

AR

Andrey Rahmatullin in Scrapy
его и так не будет
источник

Asen Баал in Scrapy
почему этот объект селениум находит
источник

Asen Баал in Scrapy
источник

Asen Баал in Scrapy
источник

Asen Баал in Scrapy
А этот нет?
источник

Asen Баал in Scrapy
driver.find_elements_by_xpath('/html/body/div/div[1]/div[1]')
[<selenium.webdriver.remote.webelement.WebElement (session="594b2bc159c603660d77cbb976fdfdfe", element="0b9c7624-5a88-45d5-b3f4-689231b0d4b9")>, <selenium.webdriver.remote.webelement.WebElement (session="594b2bc159c603660d77cbb976fdfdfe", element="c2011f95-7425-4b34-97f7-5716291bcd04")>]
driver.find_elements_by_xpath('/html/body/div/div[1]/div[1]/a')
[]
источник

Asen Баал in Scrapy
Селекторы вообще нефига не ищутся
источник