Size: a a a

2021 May 20

A

Andrii in Scrapy
websocket кто то парсил?) чет я уже второй день туплю
источник

МС

Михаил Синегубов... in Scrapy
https://github.com/scrapy/scrapy/issues/2007#issuecomment-628166243
Андрей кому то этот линк кидал, я не пробовал
источник

A

Andrii in Scrapy
Да я даже так не могу получить что то
источник

A

Andrii in Scrapy
Без скрапи
источник

A

Andrii in Scrapy
Ок еще вопрос, сайт с вебсокетом можно селениумом парсить?
источник

(

(o_O) in Scrapy
То что фронтенд из вебсокетов отрендерил - да.
источник

SS

Stepan Smirnov in Scrapy
Нужно нормализовать название языка на сайте к стандарту https://en.wikipedia.org/wiki/ISO_639-1.
Например,
"English" => "en"
"Spanish" => "es"
"eng" => "en"
"en" => "en"
"Engelsk" => "en"
"en-US" => "en"

Я пока смотрю в строну https://github.com/LuminosoInsight/langcodes
Можете посоветовать какие-то более подходящие альтернативы?
источник
2021 May 21

AR

Andrey Rahmatullin in Scrapy
ох колдстарт в контексте scrapyRT кто-то у нас оптимайзил, но я нихрена не помню какие компоненты при этом улучшали
источник

AR

Andrey Rahmatullin in Scrapy
да и поди всё равно всё что сделали уже смержено
источник

AR

Andrey Rahmatullin in Scrapy
от себя скажу что большАя часть колдстарта паука это импорт всех модулей всех пауков в проекте, так что ну вы поняли
источник

NZ

Nikita Zhidkov in Scrapy
Всем привет, использую селениум и хром драйвер для парсинга, хром драйвер с каждым запросом съедает оперативную память и в итоге падает (по task manager видно что память жрет именно хром), подскажите, пожалуйста, что нужно очищать в нем что бы такого не было?
источник

A

Andrii in Scrapy
1. Driver.quit(), 2. Не использовать селениум
источник

NZ

Nikita Zhidkov in Scrapy
Подскажешь хороший аналог для парсинга js страниц?
источник

A

Andrii in Scrapy
Что такое джс страница?
источник

NZ

Nikita Zhidkov in Scrapy
Страница с динамическим контентом, который загружается средствами js
источник

A

Andrii in Scrapy
Ну дай линк, посмотрим
источник

NZ

Nikita Zhidkov in Scrapy
Например uniqlo.com/ru
источник

NZ

Nikita Zhidkov in Scrapy
Страницу любого товара открой, поймёшь о чем я
источник

AR

Andrey Rahmatullin in Scrapy
чуть менее тривиально чем обычно, но вроде всё в аякс-запросах лежит нормально
источник

A

Andrii in Scrapy
источник