Size: a a a

2019 October 10

B

Bulatbulat48 in Scrapy
но это нужно писать в суппорт в любом случае.
источник

EB

Elisei Badanin in Scrapy
Это год назад было, если не больше
источник
2019 October 13

A

Ad in Scrapy
Всем привет) ребят, есть вопрос, строго в объяснении не судите, я новичок🤝
пишу парсер и надо что бы он проходил по ссылкам и скачивал видео, но дело в чем,
Я перехожу по постам(их ссылкам), которая хранит в себе видео, и начинаю искать эту ссылку, с форматом .mp4, но один пост хранит ссылку на видео в одном теге, а другой пост хранит ссылку на видео в другом теге, и так же есть ещё один вариант, у которого нет ни первого и ни второго тега. Я сделал так, бот
заходит на сайт проверяет, есть ли такой тег, если есть верни результат, если нет, пробуй найти этот тег, а если и его нет, то напиши мне об этом и давай дальше, я использую try: и except: он работате, но если он не видит не того , не другого, он тупо возвращает ошибку. в общем думаю  понятно объяснил ))) в Гугл ответ никак не могу найти, вероятно, сам не понимаю, буду благодарен обратной связи, спасибо👌🏾
источник

MK

Mark Kozlov in Scrapy
Ad
Всем привет) ребят, есть вопрос, строго в объяснении не судите, я новичок🤝
пишу парсер и надо что бы он проходил по ссылкам и скачивал видео, но дело в чем,
Я перехожу по постам(их ссылкам), которая хранит в себе видео, и начинаю искать эту ссылку, с форматом .mp4, но один пост хранит ссылку на видео в одном теге, а другой пост хранит ссылку на видео в другом теге, и так же есть ещё один вариант, у которого нет ни первого и ни второго тега. Я сделал так, бот
заходит на сайт проверяет, есть ли такой тег, если есть верни результат, если нет, пробуй найти этот тег, а если и его нет, то напиши мне об этом и давай дальше, я использую try: и except: он работате, но если он не видит не того , не другого, он тупо возвращает ошибку. в общем думаю  понятно объяснил ))) в Гугл ответ никак не могу найти, вероятно, сам не понимаю, буду благодарен обратной связи, спасибо👌🏾
Регулярки?
источник

К

Кирилл in Scrapy
Если есть явная ссылка с .mp4, но нет тегов, тогда используй регулярные выражения
источник

К

Кирилл in Scrapy
CrawlSpider должен легко справится
источник

К

Кирилл in Scrapy
Пишешь в allow=r'\.mp4'
источник

A

Ad in Scrapy
я использую requests и bs4
источник

К

Кирилл in Scrapy
Тогда используй re он везде будет работать. Выражение такое же
источник

К

Кирилл in Scrapy
Кирилл
Тогда используй re он везде будет работать. Выражение такое же
Такое же выражение если урл проверяешь, а если по всему тексту ищешь, тогда добавь часть для самого урла
источник

B

Bulatbulat48 in Scrapy
Ad
я использую requests и bs4
я не знаю как там в bs, но по идеи можно css-селектор через запятую div a, div img написать и перебирать циклом.
источник

A

Ad in Scrapy
всем спасибо, разобрался))
источник

A

Ad in Scrapy
отдельное спасибо @trefto
источник

B

Bulatbulat48 in Scrapy
Ad
всем спасибо, разобрался))
отлично 👍
источник

A

Ad in Scrapy
Bulatbulat48
отлично 👍
🤝
источник
2019 October 14

К

Кирилл in Scrapy
Кто-то работал с https://github.com/binux/pyspider ?
Выглядит привлекательно с простотой декораторов на перепарс, и сроком кэша, для каких-нибудь легких сайтов, что б актутальность данных держать.
Но напрягает, что репа какая-то дохлая, куча issues, и пр, которые овнер не комитит. Стоит ли связыватся с pyspider?
источник

МС

Михаил Синегубов in Scrapy
Кирилл
Кто-то работал с https://github.com/binux/pyspider ?
Выглядит привлекательно с простотой декораторов на перепарс, и сроком кэша, для каких-нибудь легких сайтов, что б актутальность данных держать.
Но напрягает, что репа какая-то дохлая, куча issues, и пр, которые овнер не комитит. Стоит ли связыватся с pyspider?
оно еще питон не выше 3.6,  как я понял
если тебя это не смущает, то пробуй. То что не обновлялос - не критерий "нельзя пользовать", тем более, для мелких проэктов.
У меня под Делфи либа до сих пор используется: последнее обновление в 2012 году, и там только поддежка новых версий делфей. Последнее функциональное обновление - в 2009 году. И ничего, на все 100500 работает :).
источник

К

Кирилл in Scrapy
Михаил Синегубов
оно еще питон не выше 3.6,  как я понял
если тебя это не смущает, то пробуй. То что не обновлялос - не критерий "нельзя пользовать", тем более, для мелких проэктов.
У меня под Делфи либа до сих пор используется: последнее обновление в 2012 году, и там только поддежка новых версий делфей. Последнее функциональное обновление - в 2009 году. И ничего, на все 100500 работает :).
В том то и дело, что даже суппорт 3.7 есть на мастере, но овнер не релизит, и куча фиксов уже люди сделали, которые не вливаются
источник

МС

Михаил Синегубов in Scrapy
Кирилл
В том то и дело, что даже суппорт 3.7 есть на мастере, но овнер не релизит, и куча фиксов уже люди сделали, которые не вливаются
дак форкни и влей :). ну и можеш в наглую отписываться, что бы тебе мержили ;)
источник

iz

izzz zzi in Scrapy
Михаил Синегубов
оно еще питон не выше 3.6,  как я понял
если тебя это не смущает, то пробуй. То что не обновлялос - не критерий "нельзя пользовать", тем более, для мелких проэктов.
У меня под Делфи либа до сих пор используется: последнее обновление в 2012 году, и там только поддежка новых версий делфей. Последнее функциональное обновление - в 2009 году. И ничего, на все 100500 работает :).
Синапс ?)
источник