Значит те кто владеет сайтом , не хотят что бы его парсили, логично, не?
Например хедхантр не дает напрямую парсить. Я взял написал кликер, который открывает страницы внутри Chrome и сохраняет их. Можно намного эффективнее это делать
Например хедхантр не дает напрямую парсить. Я взял написал кликер, который открывает страницы внутри Chrome и сохраняет их. Можно намного эффективнее это делать
Ага, ещё долго работает, я примерно 9 часов назад запустил такой парсер на selenium, такими темпами походу он будет парсится ещё день, главное чтобы какая то ошибка не вышла и не вылетело все
Тоже думал о подобном. Ты делаешь запрос на определенный сервер, ты к нему обращаешься
CDN'ы, DNS-балансировка и прочие, все вот они говорят тебе что ты даже в пределах одной сессии не обязательно перебрасываешься байтами с одним сервером