Size: a a a

2020 November 07

S

SoHard 🎄 in Scrapy
научись писать нормальные xpath
источник

8

85345 in Scrapy
Начало писать нормально. Благодорю
источник

8

85345 in Scrapy
SoHard 🎄
в скрапи есть метод re() re_first()
не сталкивался с таким методомю По этому импортировал библиотеку re
источник

S

SoHard 🎄 in Scrapy
85345
не сталкивался с таким методомю По этому импортировал библиотеку re
куча регулярок в скрапи говорит что селекторы говно
источник

S

SoHard 🎄 in Scrapy
а за название reqex в приличном обществе делают больно
источник

8

85345 in Scrapy
SoHard 🎄
научись писать нормальные xpath
писал такие на быструю руку, для теста
источник

S

SoHard 🎄 in Scrapy
источник

A

Andrii in Scrapy
Что за нашествие в группе, один вопрос круче другого :)
источник

МС

Михаил Синегубов... in Scrapy
Andrey Rahmatullin
зато ещё один человек узнал почему нельзя запускать одного паука на 12 млн итемов
Легко. Но, только не предусматривать возможность отключения и продолжения парсинга на таких объемах...
источник

8

85345 in Scrapy
Andrii
Что за нашествие в группе, один вопрос круче другого :)
Слушай вопрос был про то как правильно упорядочить столбци в CSV файл. Получил ответ что это надстройкаю Но к чему было мне неявным. Скинул код и в нем Админушка нашол его говнокодом (хотя должен признать небезосновательно ибо импортировал в scrapy сторонний модуль re незная что там уже встроеные свои регулярки. Да и xpath можно было уменьшить.) После чего сдела  прменял бывшый код с :
opp = name.xpath('//tr/td[3]/text()')[i].get()
reqex = re.compile('(@\w+|\w+)', re.M)
items['opp'] = reqex.findall(opp)
на
items['opp'] = name.xpath('//tr/td[3]/text()')[i].re('(@\w+|\w+)')
Я благодарен за подсказки. Вот только не пойму от куда столько грязи в мою сторону?
источник

AR

Andrey Rahmatullin in Scrapy
так ты не просто путаешь настройку и надстройку, но и не уверен как это слово пишется?
источник

МС

Михаил Синегубов... in Scrapy
85345
Слушай вопрос был про то как правильно упорядочить столбци в CSV файл. Получил ответ что это надстройкаю Но к чему было мне неявным. Скинул код и в нем Админушка нашол его говнокодом (хотя должен признать небезосновательно ибо импортировал в scrapy сторонний модуль re незная что там уже встроеные свои регулярки. Да и xpath можно было уменьшить.) После чего сдела  прменял бывшый код с :
opp = name.xpath('//tr/td[3]/text()')[i].get()
reqex = re.compile('(@\w+|\w+)', re.M)
items['opp'] = reqex.findall(opp)
на
items['opp'] = name.xpath('//tr/td[3]/text()')[i].re('(@\w+|\w+)')
Я благодарен за подсказки. Вот только не пойму от куда столько грязи в мою сторону?
Да просто ты достал всех вопросами начального уровня. Причем, судя по количеству, ты даже не пытается сам разобраться.
источник

A

Andrii in Scrapy
"Импортировал в скрейпи сторонний модуль re" 🙄😆
источник

8

85345 in Scrapy
Andrey Rahmatullin
это настройка.
я понял что ты про надстройку писал
источник

AR

Andrey Rahmatullin in Scrapy
ну я и говорю
источник

8

85345 in Scrapy
Михаил Синегубов
Да просто ты достал всех вопросами начального уровня. Причем, судя по количеству, ты даже не пытается сам разобраться.
За 2 дня задал 3 вопроса и то 1 с них был повторением второго. 😱
источник

S

SoHard 🎄 in Scrapy
85345
Слушай вопрос был про то как правильно упорядочить столбци в CSV файл. Получил ответ что это надстройкаю Но к чему было мне неявным. Скинул код и в нем Админушка нашол его говнокодом (хотя должен признать небезосновательно ибо импортировал в scrapy сторонний модуль re незная что там уже встроеные свои регулярки. Да и xpath можно было уменьшить.) После чего сдела  прменял бывшый код с :
opp = name.xpath('//tr/td[3]/text()')[i].get()
reqex = re.compile('(@\w+|\w+)', re.M)
items['opp'] = reqex.findall(opp)
на
items['opp'] = name.xpath('//tr/td[3]/text()')[i].re('(@\w+|\w+)')
Я благодарен за подсказки. Вот только не пойму от куда столько грязи в мою сторону?
Поменял , но это тоже говнокод
источник

8

85345 in Scrapy
SoHard 🎄
Поменял , но это тоже говнокод
А вот это интересно)
И что можно улучшить?)
источник

S

SoHard 🎄 in Scrapy
Всё
источник

A

Andrii in Scrapy
1. Кидать код на пастебин
источник