Size: a a a

2019 October 16

АП

Агент Печенька in Scrapy
Хех.
1.3.3, старое.
источник

EB

Elisei Badanin in Scrapy
при том сайт, данные на котором спаршены с 2гиса
источник

МС

Михаил Синегубов in Scrapy
Elisei Badanin
мир тесен, сейчас проверял логи своих сайтов, нашел “Scrapy/1.3.3 (+http://scrapy.org)” в юсер агентах о_О
Тебя тырят, срочно ставь защиту🤬
источник

EB

Elisei Badanin in Scrapy
да хрен с ними, я всеравно для этого сайта парсил 2гис, просто интерестно смысл у меня парсить, а не у первоистояников
источник

EB

Elisei Badanin in Scrapy
это же нужно было парсер писать
источник

EB

Elisei Badanin in Scrapy
маджестик лицемеры, себя в хорших ботов засунули, а эхрефс в комерческих хД
источник
2019 October 17

МС

Михаил Синегубов in Scrapy
Народ, чет конкретный затуп. Есть текст, в нем куча тегов "р", "br", как их поудалять, что бы визуальное форматирование (в плане переносов строк) осталось на месте?
источник

АН

Алексей Нагорский in Scrapy
Михаил Синегубов
Народ, чет конкретный затуп. Есть текст, в нем куча тегов "р", "br", как их поудалять, что бы визуальное форматирование (в плане переносов строк) осталось на месте?
Не знаю как в рамках scrapy, а так я использовал html2text питоновский, вродь неплохо получалось
источник

s

serhii in Scrapy
Михаил Синегубов
Народ, чет конкретный затуп. Есть текст, в нем куча тегов "р", "br", как их поудалять, что бы визуальное форматирование (в плане переносов строк) осталось на месте?
from w3lib.html import remove_tags
remove_tags(твой текст)
источник

МС

Михаил Синегубов in Scrapy
угу, всем спс, попробую
источник

s

serhii in Scrapy
Михаил Синегубов
угу, всем спс, попробую
расскажи потом, что помогло и что заюзал.
частенько такая задача возникает.
источник

МС

Михаил Синегубов in Scrapy
кароч, насчет удаления тегов и с сохранием визуалного переноса строк

from w3lib.html import remove_tags
remove_tags(твой текст)
- работает как просто удаление тегов, переносы строк не добавляет

html2text  - отлично работает "из коробки", только не разобрался с "single_line_break", по идее это "оставлять один перенос". Но у меня в тексте остается "\n\n", не копался, для меня не критично

закинет кто в FAQ ? или самому кидать?
источник

B

Bulatbulat48 in Scrapy
закинь сам
источник

АН

Алексей Нагорский in Scrapy
Михаил Синегубов
кароч, насчет удаления тегов и с сохранием визуалного переноса строк

from w3lib.html import remove_tags
remove_tags(твой текст)
- работает как просто удаление тегов, переносы строк не добавляет

html2text  - отлично работает "из коробки", только не разобрался с "single_line_break", по идее это "оставлять один перенос". Но у меня в тексте остается "\n\n", не копался, для меня не критично

закинет кто в FAQ ? или самому кидать?
Мб подразумевается, что он уберет два br, \n могут и в тексте ведь быть
источник

МС

Михаил Синегубов in Scrapy
Bulatbulat48
закинь сам
брось ссыль, я опять ее пролюбил 😂
источник

B

Bulatbulat48 in Scrapy
Михаил Синегубов
брось ссыль, я опять ее пролюбил 😂
прикреплена)
источник

МС

Михаил Синегубов in Scrapy
Bulatbulat48
прикреплена)
нэть
источник

МС

Михаил Синегубов in Scrapy
я опять закрыл прилепку :)
источник

B

Bulatbulat48 in Scrapy
+
источник

МС

Михаил Синегубов in Scrapy
мля, так вот что это за "ru-scrapy-python" 😂
источник